Bias-Variance Trade-off: Makine Öğrenmesinin Merkez Gerilimi
Basit model sürekli aynı yere ama yanlış vurur (bias). Karmaşık model her yere ama tutarsız vurur (variance). Çözüm: ikisi arasında denge.

Nişan tahtası örneği
İki okçu hayal edin:
- Okçu A: hep aynı yere vurur — ama hep merkezin dışında.
- Okçu B: bazen merkeze, bazen çok uzak — dağınık.
İkisi de kötü, ama farklı sebeplerle. ML modelleri de aynı.
- Bias yüksek (Okçu A): sistematik hata — model fazla basit.
- Variance yüksek (Okçu B): tutarsızlık — model fazla karmaşık.
İyi okçu: küçük bias + küçük variance.
Matematik
Bir modelin beklenen hata'sı (squared loss için):
Üç parça:
- Bias²: modelin gerçek 'den ortalama farkı.
- Variance: modelin farklı eğitim setlerine duyarlılığı.
- Irreducible noise: temel veri gürültüsü.
Karmaşıklık ile değişim
| Karmaşıklık | Bias | Variance | Toplam hata |
|---|---|---|---|
| Çok düşük (1.dereceden polinom) | Yüksek | Düşük | Yüksek (underfit) |
| Orta | Düşük | Düşük | Düşük (en iyi) |
| Çok yüksek (50.dereceden) | Düşük | Yüksek | Yüksek (overfit) |
Underfitting
Belirtileri:
- Eğitim hatası yüksek.
- Test hatası eğitime yakın (her ikisi de kötü).
- Model basit.
Tedavi:
- Daha karmaşık model.
- Daha çok özellik (feature engineering).
- Daha derin sinir ağı.
Overfitting
Belirtileri:
- Eğitim hatası çok düşük.
- Test hatası çok yüksek.
- Model eğitim verisini ezberlemiş.
Tedavi:
- Düzenlileştirme (L1, L2).
- Veri augmentation.
- Daha çok veri.
- Dropout, batch norm.
- Erken durdurma.
- Daha basit model.
Klasik öğrenme eğrileri
X ekseni: model karmaşıklığı.
Y ekseni: hata.
- Eğitim hatası: monoton düşer (sıfıra kadar).
- Test hatası: önce düşer (bias azalır), sonra çıkar (variance artar). U şekli.
En iyi nokta: U'nun dibi.
Modern AI'da paradoks
Klasik ML: daha karmaşık model → overfit. Bias-variance trade-off.
Modern derin öğrenme: çok daha karmaşık model (milyarlarca parametre), az veriyle mümkün. Bias düşük, variance düşük gibi.
Bu çift düşüş (double descent) fenomeni 2018'de keşfedildi:
- Karmaşıklık az → underfit.
- Karmaşıklık orta → optimal (klasik U).
- Karmaşıklık çok → tekrar düşer!
Sebep tam anlaşılmadı; implicit regularization hipotezi.
Pratik teşhis
Eğitim hatası > Test hatası farkı:
- Küçük fark + ikisi de yüksek: underfit.
- Küçük fark + ikisi de düşük: optimal.
- Büyük fark: overfit.
Bagging vs Boosting
- Bagging (Random Forest): variance azaltır, bias değişmez.
- Boosting (Gradient Boosting): bias azaltır, variance artırabilir.
Birleştir → optimal model.
Düzenlileştirme matematiği
L2 regularization:
artırılırsa:
- Variance düşer (model basitleşir).
- Bias artar.
trade-off ayarı.
Cross-validation rolü
K-fold cross-validation:
- Modeli K farklı bölünmede dene.
- Ortalama hata = beklenen test hatası.
- Bias-variance ayarı için doğru araç.
Türk endüstri örneği
- Bankacılık skoru: lojistik regresyon (yüksek bias, düşük variance) vs gradient boosting (düşük bias, orta variance) — kurum tercih farkı.
- Tıbbi tanı: yüksek variance kabul edilmez → ensemble.
- Reklam tıklama: çok veri var → düşük variance, model karmaşıklığı serbest.
"Bias" iki anlam
Dikkat: ML'de "bias" iki farklı anlamda:
- Bias-variance trade-off: model sistematik hata.
- Algorithmic bias / Fairness: ayrımcılık (cinsiyet, ırk).
İkincisi tamamen farklı bir konu (etik AI).
Felsefe
Andrew Ng'in mesajı: "Yüksek bias varsa eğitim hatasına bak; yüksek variance varsa eğitim-test farkına bak. Sonra ona göre çözüm uygula."
Bu basit kural milyonlarca ML projesinin teşhis ağacı.
Kapanış
Bias-variance trade-off ML'nin merkez konseptidir. Underfit vs overfit, regularization vs serbest, basit model vs karmaşık — hepsinin matematiksel açıklaması burada. Modern derin öğrenmenin double descent paradoksu hâlâ araştırılıyor.
Bir ML mühendisinin olgunluk işareti: hatayı gördükten sonra hangi taraf (bias mı variance mı) sorusunu sormak.
Etiketler
Kendinizi Test Edin
Cevaplarınız profilinizde istatistik olarak saklanır.
1. Bias yüksek modeller?
2. Variance yüksek modeller?
3. Düzenlileştirme ne yapar?
4. Modern derin öğrenmede paradoks?
5. Bagging ve Boosting farkı?
İlgili Yazılar
Sekreter Problemi: Hayatın En İyi Seçimini Yapmak için "%37 Kuralı"
Bir işe alma görüşmesi, bir ev arama süreci, hatta hayat arkadaşı seçimi… Hepsinin altında aynı klasik matematik problemi yatar. Cevap şaşırtıcı biçimde tek bir sayıya bağlıdır: %37.
MatematikPisagor Teoremi ve Saklı Bir Sır: İrrasyonel Sayılar Nasıl Keşfedildi?
Dik üçgenlerle ilgili o ünlü kural, aynı zamanda matematik tarihinin en sarsıcı keşfine yol açtı: kesir olarak yazılamayan sayılar. Üstelik bu keşif, bir bilim topluluğunu temellerinden sarstı.
MatematikFibonacci Dizisi ve Altın Oran: Tavşanlardan Ayçiçeklerine Uzanan Örüntü
Bir tavşan üretme bilmecesiyle başlayan basit bir sayı dizisi, ayçiçeği tohumlarından çam kozalaklarına, deniz kabuklarından galaksilere kadar doğanın her yerinde nasıl karşımıza çıkıyor?