Simpson Paradoksu: Aynı Veri Hem "İyi" Hem "Kötü" Diyebilir mi?
Bir ilaç, hem kadınlarda hem erkeklerde A tedavisinden daha iyi sonuç veriyor — ama herkes bir araya toplanınca aniden daha kötü görünüyor. Bu çelişki bir hata değil; istatistiğin en sinsi tuzağı.

Sayılar Yalan Söylemez mi?
"Sayılar yalan söylemez" deriz. Ama sayıların nasıl gruplandığı, bizi tamamen zıt sonuçlara götürebilir. Bunun en çarpıcı örneği, Simpson Paradoksu denen şaşırtıcı istatistik olgusudur.
Paradoksu en iyi bir örnekle anlarız. İki tedavi yöntemini — A ve B — karşılaştırdığımızı düşünelim.
Böbrek Taşı Örneği (Gerçek Bir Vakaya Dayanır)
Diyelim ki böbrek taşı için iki tedavi var. Hastaları küçük taşlılar ve büyük taşlılar diye ayıralım.
Küçük taşlarda:
- A tedavisi: 87 hastadan 81'i başarılı → %93
- B tedavisi: 270 hastadan 234'ü başarılı → %87
- A daha iyi! ✓
Büyük taşlarda:
- A tedavisi: 263 hastadan 192'si başarılı → %73
- B tedavisi: 80 hastadan 55'i başarılı → %69
- A yine daha iyi! ✓
Yani A tedavisi, hem küçük taşlarda hem büyük taşlarda B'den daha başarılı. Mantıklı sonuç: A tedavisi genel olarak daha iyi, değil mi?
Çarpıcı Tersine Dönüş
Şimdi tüm hastaları birleştirelim ve genel başarı oranına bakalım:
- A tedavisi: toplam 350 hastadan 273'ü başarılı → %78
- B tedavisi: toplam 350 hastadan 289'u başarılı → %83
- B daha iyi! ✗
İnanılması güç ama doğru: A her iki alt grupta da kazanıyor, ama toplamda kaybediyor! Aynı veri, nasıl baktığınıza göre iki zıt cevap veriyor. Bu, bir hesap hatası değil — gerçek, matematiksel olarak tutarlı bir durum. İşte Simpson Paradoksu budur.
Sihir Nerede? — Gizli Değişken
Bu kafa karıştırıcı tersine dönüşün nedeni, gözden kaçan bir faktördür: hastaların gruplara dağılımındaki dengesizlik.
Dikkat edin: A tedavisi çoğunlukla büyük taşlı (zor, başarı oranı düşük) hastalara uygulanmış. B tedavisi ise çoğunlukla küçük taşlı (kolay, başarı oranı yüksek) hastalara verilmiş.
Yani B, "kolay" vakaların çoğunu aldığı için genel ortalaması şişmiş görünüyor. A ise "zor" vakaların yükünü taşıdığı için, her grupta daha iyi olmasına rağmen genel ortalaması düşük çıkıyor. Burada taş büyüklüğü, hem tedavi seçimini hem de başarıyı etkileyen gizli bir faktör — buna karıştırıcı değişken (confounding variable) denir.
Doğru karşılaştırma, "elmayla elmayı" karşılaştırmaktır: Aynı zorluktaki hastalarda hangi tedavi daha iyi? Cevap: A. Toplam ortalama, bu durumda yanıltıcıdır.
Hangi Cevap "Doğru"?
İşin en ince yanı şu: Simpson Paradoksu'nda hangi bakışın doğru olduğu, verinin ne anlama geldiğine bağlıdır; sadece matematiğe değil.
Böbrek taşı örneğinde, ayrılmış gruplara bakmak doğrudur — çünkü taş büyüklüğü tedavi başarısını gerçekten etkiler ve bunu hesaba katmalıyız. Bir doktor olarak, hastanıza taş büyüklüğüne uygun, her grupta daha iyi olan tedaviyi (A) önerirsiniz.
Ama başka durumlarda birleştirilmiş veriye bakmak doğru olabilir. Hangisinin geçerli olduğuna karar vermek, istatistik bilgisi kadar konuyu anlamayı da gerektirir. İşte bu yüzden Simpson Paradoksu, "veri kendi başına konuşmaz; onu doğru yorumlamak gerekir" dersinin en güçlü örneğidir.
Gerçek Hayatta Nereler de Karşımıza Çıkar?
Simpson Paradoksu sadece teorik bir merak değil; ciddi sonuçları olabilen yaygın bir tuzaktır:
- Tıp: İlaç ve tedavi karşılaştırmalarında, hasta gruplarının farklı olması yanıltıcı sonuçlar doğurabilir. Klinik araştırmaların neden bu kadar dikkatli tasarlandığının bir nedeni budur.
- Ücret eşitsizliği analizleri: Bir şirkette genel olarak cinsiyetler arası ücret farkı varmış gibi görünebilir, ama her bölüm ayrı incelendiğinde durum farklı çıkabilir (ya da tam tersi).
- Eğitim ve sınav sonuçları: Ünlü bir vakada, bir üniversitenin genel kabul oranları bir cinsiyet aleyhine görünürken, bölüm bölüm bakıldığında durumun tersine döndüğü ortaya çıkmıştı.
- Spor istatistikleri: Bir oyuncunun iki sezonun her birinde diğerinden daha iyi vuruş ortalaması olabilir, ama iki sezon birleştirilince daha kötü görünebilir.
Sonuç
Simpson Paradoksu, istatistiğe körü körüne güvenmenin tehlikesini gösteren en güzel uyarıdır. Aynı veriler, nasıl gruplandığına bağlı olarak bize birbirine taban tabana zıt hikâyeler anlatabilir. Ve çoğu zaman, sahnenin arkasında, sonucu sessizce çeviren gizli bir değişken vardır.
Bir dahaki sefere bir istatistik ya da "araştırmalar gösteriyor ki..." cümlesi gördüğünüzde, şu soruyu sorun: "Bu veri nasıl gruplanmış? Acaba gözden kaçan bir faktör var mı?" Çünkü sayılar yalan söylemez — ama onları yanlış gruplarsak, gerçeği gizleyebilirler.
Etiketler
Kendinizi Test Edin
Cevaplarınız profilinizde istatistik olarak saklanır.
1. Simpson Paradoksu nedir?
2. Böbrek taşı örneğinde A tedavisi her iki grupta da daha iyiyken toplamda neden kötü göründü?
3. Paradoksun arkasındaki "gizli" faktöre ne denir?
4. Simpson Paradoksu'nda "hangi bakış doğru" sorusunun cevabı neye bağlıdır?
5. Simpson Paradoksu'nun verdiği temel ders nedir?
İlgili Yazılar
Sekreter Problemi: Hayatın En İyi Seçimini Yapmak için "%37 Kuralı"
Bir işe alma görüşmesi, bir ev arama süreci, hatta hayat arkadaşı seçimi… Hepsinin altında aynı klasik matematik problemi yatar. Cevap şaşırtıcı biçimde tek bir sayıya bağlıdır: %37.
MatematikPisagor Teoremi ve Saklı Bir Sır: İrrasyonel Sayılar Nasıl Keşfedildi?
Dik üçgenlerle ilgili o ünlü kural, aynı zamanda matematik tarihinin en sarsıcı keşfine yol açtı: kesir olarak yazılamayan sayılar. Üstelik bu keşif, bir bilim topluluğunu temellerinden sarstı.
MatematikFibonacci Dizisi ve Altın Oran: Tavşanlardan Ayçiçeklerine Uzanan Örüntü
Bir tavşan üretme bilmecesiyle başlayan basit bir sayı dizisi, ayçiçeği tohumlarından çam kozalaklarına, deniz kabuklarından galaksilere kadar doğanın her yerinde nasıl karşımıza çıkıyor?