Naive Bayes'in "saf" varsayımı nedir?

Özellikler (kelimeler) birbirinden koşullu bağımsız

Naive Bayes'in en ünlü uygulaması nedir?

Spam filtresi — modern e-posta hizmetlerinin standardı

Naive Bayes neden işe yarıyor varsayımı yanlış olmasına rağmen?

Sınıflandırma için tam olasılık değil, sıralama yeterli; varsayım yanlış olsa da sıralama çoğu zaman doğru

Naive Bayes'in temel sınırlaması nedir?

Sıfır olasılık (Laplace smoothing ile çözülür) + bağımsızlık varsayımı + bağlam yok

Naive Bayes hangi temel teoreme dayanır?

Bayes teoremi: $P(A|B) = P(B|A) \cdot P(A) / P(B)$

Naive Bayes: Spam Filtrelerin Arkasındaki "Saf" Ama Etkili Algoritma

"Bu e-posta spam mi?"

Bir e-postanın spam olma olasılığı:

$P(\text{spam} \mid \text{kelimeler}) = \frac{P(\text{kelimeler} \mid \text{spam}) \cdot P(\text{spam})}{P(\text{kelimeler})}$

Bayes teoremi. Sade.

Sorun: "kelimeler" 10000+ farklı. $P(\text{kelimeler} \mid \text{spam})$ hesaplamak için tüm kombinasyonlar'a gerek var. İmkansız.

"Saf" varsayım

Naive Bayes: kelimelerin birbirinden bağımsız olduğunu varsay.

$P(w_1, w_2, \ldots \mid \text{spam}) = P(w_1 \mid \text{spam}) \cdot P(w_2 \mid \text{spam}) \cdots$

Açıkça yanlış: "Viagra" ve "free" birlikte daha sık. Ama varsayım işe yarıyor.

Pratik uygulama

Eğitim:

Spam ve normal e-postaları topla.
Her kelime için $P(w \mid \text{spam})$ ve $P(w \mid \text{normal})$ hesapla.
Önsel $P(\text{spam}), P(\text{normal})$ .

Tahmin:

$\frac{P(\text{spam} \mid e)}{P(\text{normal} \mid e)} = \frac{P(\text{spam})}{P(\text{normal})} \prod_w \frac{P(w \mid \text{spam})}{P(w \mid \text{normal})}$

Logaritma alıp toplam yap.

Niçin işe yarıyor?

Varsayım yanlış, ama:

Sıralama çoğu zaman doğru.
Hızlı eğitim, çok hızlı tahmin.
Az veri ile iyi.
Yorumlanabilir: hangi kelime hangi sınıfa katkı.

Tarihsel köken

1960'lar: ilk spam filtre ataları.
1998: Sahami, Dumais, Heckerman, Horvitz — "A Bayesian approach to filtering junk e-mail". Modern spam filtrenin başlangıcı.
2002: Paul Graham — "A Plan for Spam". Naive Bayes'i popüler yaptı.

Modern uygulamalar

1. Spam filtresi

Gmail, Outlook — hâlâ Naive Bayes ailesi kullanır (modern derin öğrenme ile birleşik).

2. Metin sınıflandırma

Haber kategorizasyonu, sentiment analysis.

3. Tıbbi tanı

Semptomdan hastalık olasılığı.

4. Bilimsel makale sınıflandırma

PubMed, ArXiv kategorileri.

5. Müzik öneri

Şarkı kategorizasyonu.

Sınırlamalar

Bağımsızlık varsayımı yanlış.
Sıfır olasılık problemi: bilinmeyen kelime → çarpım sıfır. Laplace smoothing ile çözülür.
Bağlam yok: kelime sırası önemsiz.
Negation problemi: "iyi değil" pozitif analiz edebilir.

Modern alternatifler

Logistic regression: Naive Bayes'ten genelde daha iyi.
SVM: metin için klasik.
Transformer (BERT, GPT): modern derin öğrenme.

Yine de Naive Bayes:

Baseline olarak değerli.
Az veri/hesap için ideal.
Yorumlanabilir.

Niçin "naive"?

"Saf" — kelimelerin bağımsız olduğunu varsaymak. Doğal dilde gerçek değil, ama hesap olarak gerekli.

Modern matematikte "doğru olmayan ama yararlı varsayım"ın klasik örneği.

Sonuç

Naive Bayes:

Koşullu bağımsızlık varsayımı.
Bayes teoremi + saf varsayım = pratik algoritma.
Spam filtreleri klasiği.
Metin sınıflandırma baseline'ı.
Yanlış ama etkili — modern istatistiğin paradoksal başarısı.

Modern makine öğrenmesi öğrencisinin ilk öğrendiği algoritmalardan. Sade, etkili, eğitici.

"Yanlış varsayım + sade matematik = sürpriz işe yarama." Naive Bayes'in paradigması.