Naive Bayes: Spam Filtrelerin Arkasındaki "Saf" Ama Etkili Algoritma
Bir e-posta spam mi? "Viagra" + "free" + "click now" kelimeleri varsa muhtemelen. Naive Bayes **kelimelerin bağımsız olduğunu varsayar** — açıkça yanlış. Yine de %95+ doğrulukla **spam filtrelemenin altın standardı**.

"Bu e-posta spam mi?"
Bir e-postanın spam olma olasılığı:
Bayes teoremi. Sade.
Sorun: "kelimeler" 10000+ farklı. hesaplamak için tüm kombinasyonlar'a gerek var. İmkansız.
"Saf" varsayım
Naive Bayes: kelimelerin birbirinden bağımsız olduğunu varsay.
Açıkça yanlış: "Viagra" ve "free" birlikte daha sık. Ama varsayım işe yarıyor.
Pratik uygulama
Eğitim:
- Spam ve normal e-postaları topla.
- Her kelime için ve hesapla.
- Önsel .
Tahmin:
Logaritma alıp toplam yap.
Niçin işe yarıyor?
Varsayım yanlış, ama:
- Sıralama çoğu zaman doğru.
- Hızlı eğitim, çok hızlı tahmin.
- Az veri ile iyi.
- Yorumlanabilir: hangi kelime hangi sınıfa katkı.
Tarihsel köken
- 1960'lar: ilk spam filtre ataları.
- 1998: Sahami, Dumais, Heckerman, Horvitz — "A Bayesian approach to filtering junk e-mail". Modern spam filtrenin başlangıcı.
- 2002: Paul Graham — "A Plan for Spam". Naive Bayes'i popüler yaptı.
Modern uygulamalar
1. Spam filtresi
Gmail, Outlook — hâlâ Naive Bayes ailesi kullanır (modern derin öğrenme ile birleşik).
2. Metin sınıflandırma
Haber kategorizasyonu, sentiment analysis.
3. Tıbbi tanı
Semptomdan hastalık olasılığı.
4. Bilimsel makale sınıflandırma
PubMed, ArXiv kategorileri.
5. Müzik öneri
Şarkı kategorizasyonu.
Sınırlamalar
- Bağımsızlık varsayımı yanlış.
- Sıfır olasılık problemi: bilinmeyen kelime → çarpım sıfır. Laplace smoothing ile çözülür.
- Bağlam yok: kelime sırası önemsiz.
- Negation problemi: "iyi değil" pozitif analiz edebilir.
Modern alternatifler
- Logistic regression: Naive Bayes'ten genelde daha iyi.
- SVM: metin için klasik.
- Transformer (BERT, GPT): modern derin öğrenme.
Yine de Naive Bayes:
- Baseline olarak değerli.
- Az veri/hesap için ideal.
- Yorumlanabilir.
Niçin "naive"?
"Saf" — kelimelerin bağımsız olduğunu varsaymak. Doğal dilde gerçek değil, ama hesap olarak gerekli.
Modern matematikte "doğru olmayan ama yararlı varsayım"ın klasik örneği.
Sonuç
Naive Bayes:
- Koşullu bağımsızlık varsayımı.
- Bayes teoremi + saf varsayım = pratik algoritma.
- Spam filtreleri klasiği.
- Metin sınıflandırma baseline'ı.
- Yanlış ama etkili — modern istatistiğin paradoksal başarısı.
Modern makine öğrenmesi öğrencisinin ilk öğrendiği algoritmalardan. Sade, etkili, eğitici.
"Yanlış varsayım + sade matematik = sürpriz işe yarama." Naive Bayes'in paradigması.
Etiketler
Kendinizi Test Edin
Cevaplarınız profilinizde istatistik olarak saklanır.
1. Naive Bayes'in "saf" varsayımı nedir?
2. Naive Bayes'in en ünlü uygulaması nedir?
3. Naive Bayes neden işe yarıyor varsayımı yanlış olmasına rağmen?
4. Naive Bayes'in temel sınırlaması nedir?
5. Naive Bayes hangi temel teoreme dayanır?
İlgili Yazılar
Sekreter Problemi: Hayatın En İyi Seçimini Yapmak için "%37 Kuralı"
Bir işe alma görüşmesi, bir ev arama süreci, hatta hayat arkadaşı seçimi… Hepsinin altında aynı klasik matematik problemi yatar. Cevap şaşırtıcı biçimde tek bir sayıya bağlıdır: %37.
MatematikPisagor Teoremi ve Saklı Bir Sır: İrrasyonel Sayılar Nasıl Keşfedildi?
Dik üçgenlerle ilgili o ünlü kural, aynı zamanda matematik tarihinin en sarsıcı keşfine yol açtı: kesir olarak yazılamayan sayılar. Üstelik bu keşif, bir bilim topluluğunu temellerinden sarstı.
MatematikFibonacci Dizisi ve Altın Oran: Tavşanlardan Ayçiçeklerine Uzanan Örüntü
Bir tavşan üretme bilmecesiyle başlayan basit bir sayı dizisi, ayçiçeği tohumlarından çam kozalaklarına, deniz kabuklarından galaksilere kadar doğanın her yerinde nasıl karşımıza çıkıyor?