Lojistik Regresyon: Makine Öğrenmesinin "Gizli Bel Kemiği"
En basit denetimli öğrenme modeli — ama her sinir ağının son katmanı, her LLM'in token tahmini hâlâ lojistik regresyondan ibaret.

Soru: "Evet mi, hayır mı?"
Modern dünyanın yarısı bu soruyla başlar:
- Bu e-posta spam mi?
- Hasta ilacı kullanmalı mı?
- Bu işlem dolandırıcılık mı?
- Modelin tahmin ettiği sonraki kelime "kedi" mi yoksa başkası mı?
Hepsi ikili sınıflandırma. Klasik çözüm: lojistik regresyon (1944, Joseph Berkson).
Doğrusal regresyondan farkı
Doğrusal regresyon: — sayısal hedef.
Sınıflandırma için problem: çıktı (0,1) aralığında olmalı. Çözüm: sigmoid.
Lojistik regresyon:
Sigmoid'in özellikleri
- .
- .
- .
- Türev: — backprop için güzel.
Eğitim: maximum likelihood
Veriden olasılığı en yüksek hale getir:
Bu binary cross-entropy kaybı. Konvekstir → tek optimumu var, gradient descent garantili olarak bulur.
Yorumlanabilirlik
Lojistik regresyon şeffaftır:
- Her özelliğin log-odds katkısı.
- özelliğin odds çarpanı.
Örnek: tıpta "sigara " → sigara odds'u kat artırır.
Bu, kara kutu modellere göre muazzam avantaj.
Çok sınıf: softmax
İki yerine sınıf?
Bu softmax. Lojistik regresyonun çok sınıflı genelleştirmesi = multinomial logistic.
Modern AI bağlantısı
Her sinir ağının son katmanı lojistik regresyondan ibarettir:
- Görüntü sınıflandırma: ResNet son katmanı softmax → 1000 sınıf üzerinde lojistik.
- LLM token tahmini: transformer çıkışı → vocabulary boyutunda softmax → her token bir lojistik regresyon.
Yani GPT-4 bile son katmanda lojistik regresyon yapıyor. Önceki katmanlar sadece iyi özellik üretiyor.
Düzenlileştirme
Aşırı uyumdan korunmak için:
- L2 (Ridge): — küçük ağırlıkları sever.
- L1 (Lasso): — seyrek modeller (özellik seçimi).
- Elastic Net: ikisinin karışımı.
Modern derin öğrenmedeki weight decay bunun aynısı.
Hangi durumlarda iyi?
- Doğrusal ayrılabilir veri: mükemmel.
- Az veri: aşırı uyum riski düşük (parametre sayısı az).
- Yorumlanabilirlik gereken alanlar: tıp, finans, hukuk.
- Baseline: her ML projesinde ilk çalıştırılan model.
Sınırlamalar
- Doğrusal olmayan ilişkileri modelleyemez — özellik mühendisliği şart.
- Yüksek boyutta zayıf — derin ağ alır.
- Görüntü, metin gibi ham veride başarısız — temsil öğrenmesi lazım.
Modern kombinasyon: derin ağ özellikler öğrenir + son katmanda lojistik.
Tarihsel önem
- 1838: Verhulst — lojistik fonksiyonu nüfus modeli için.
- 1944: Joseph Berkson — "logit" terimini uydurdu, istatistiksel teorisi.
- 1972: David Cox — modern eğitim algoritmaları.
- 1986: Sinir ağında "perceptron" + sigmoid → ilk gizli katmanlı ağlar.
- Bugün: tüm derin öğrenmenin son katmanı.
"Lojistik" adı nereden?
Verhulst'un nüfus modeli — "düzenli/oranlı büyüme". Latince logisticus ("hesap, mantık"). Sonradan logit = log(odds) ile ilişkilendirildi.
Kapanış
Lojistik regresyon basit görünür ama modern AI'ın temel taşı. Her LLM, her CNN, her tıbbi karar destek sistemi sonunda bir lojistik regresyonla biter. Öğrenmesi 1 saat, faydası ömür boyu.
Ders: yeni bir ML problemi → önce lojistik regresyon dene. Eğer çalışırsa, derin ağa ihtiyacın yok.
Etiketler
Kendinizi Test Edin
Cevaplarınız profilinizde istatistik olarak saklanır.
1. Sigmoid fonksiyonu?
2. Kayıp fonksiyonu?
3. Lojistik regresyon modern AI'da nerede?
4. Çok sınıf genelleştirmesi?
5. Yorumlanabilirlik avantajı?
İlgili Yazılar
Sekreter Problemi: Hayatın En İyi Seçimini Yapmak için "%37 Kuralı"
Bir işe alma görüşmesi, bir ev arama süreci, hatta hayat arkadaşı seçimi… Hepsinin altında aynı klasik matematik problemi yatar. Cevap şaşırtıcı biçimde tek bir sayıya bağlıdır: %37.
MatematikPisagor Teoremi ve Saklı Bir Sır: İrrasyonel Sayılar Nasıl Keşfedildi?
Dik üçgenlerle ilgili o ünlü kural, aynı zamanda matematik tarihinin en sarsıcı keşfine yol açtı: kesir olarak yazılamayan sayılar. Üstelik bu keşif, bir bilim topluluğunu temellerinden sarstı.
MatematikFibonacci Dizisi ve Altın Oran: Tavşanlardan Ayçiçeklerine Uzanan Örüntü
Bir tavşan üretme bilmecesiyle başlayan basit bir sayı dizisi, ayçiçeği tohumlarından çam kozalaklarına, deniz kabuklarından galaksilere kadar doğanın her yerinde nasıl karşımıza çıkıyor?