Korelasyon ve Nedensellik: Dondurma Boğulma Nedeni mi?
Yazın dondurma satışları artar; aynı yaz boğulma vakaları artar. Dondurma boğulmaya mı yol açıyor? Hayır — ortak sebep var: sıcak hava. İstatistikteki en sık karıştırılan iki kavram.

Dondurma ve boğulma vakaları
Bir istatistikçi şu veriyi paylaşıyor:
"Dondurma satışları arttıkça boğulma vakaları artar. İkisi arasında güçlü pozitif korelasyon var."
Sezgisel okuma: "Dondurma yiyenler boğuluyor!"
Yanlış. Ortak bir üçüncü sebep var: sıcak hava (yaz). Yazın hem dondurma yenilir, hem insanlar denize girer, hem boğulma vakaları artar. Dondurma ile boğulma arasında gerçek nedensel bağ yok — sadece görünüşte ilişki.
Bu, modern istatistikteki en büyük tuzaklardan biri: korelasyon ≠ nedensellik.
Korelasyon nedir?
İki değişken arasındaki doğrusal ilişkinin sayısal ölçüsü.
Pearson korelasyon katsayısı:
değeri ile arasında:
- : mükemmel pozitif doğrusal ilişki.
- : doğrusal ilişki yok.
- : mükemmel negatif doğrusal ilişki.
(Cauchy-Schwarz eşitsizliği 'i garantiler.)
Korelasyon türleri
Pozitif korelasyon
İki değişken aynı yönde hareket eder. Örnek: boy ile kilo.
Negatif korelasyon
Ters yönde. Örnek: sigara içme ile akciğer kapasitesi.
Sıfır korelasyon
Doğrusal ilişki yok — ama doğrusal olmayan ilişki olabilir (örn. verisi).
Nedensellik nedir?
A nedeni B'ye yol açar demek. A değişirse, B değişir; A olmasaydı, B olmazdı.
Korelasyon istatistiksel'dir; nedensellik ontolojik. İkisi farklı.
4 sahte korelasyon tipi
1) Ortak sebep (confounding)
Yukarıdaki dondurma örneği. Üçüncü değişken (sıcaklık) hem A'yı hem B'yi etkiliyor; A ve B arasında doğrudan bağ yok.
Klasik örnek: "İtfaiyeci sayısı ile yangın hasarı arasında pozitif korelasyon vardır." Sebebi: büyük yangınlarda hem itfaiyeci hem hasar çok. İtfaiyeciler yangını yapmıyor!
2) Ters nedensellik
A → B sandığımız ilişkide aslında B → A vardır.
Örnek: "Mutlu insanlar daha az sigara içer." Sebep-sonuç hangisi? Mutluluk azaltıyor mu sigara içmeyi? Sigara azaltmak mutluluk getiriyor mu? Veya başka faktör?
3) Tesadüfi korelasyon
Pür şans. Yeterince çok değişken karşılaştırırsanız, tesadüfen korelasyon bulursunuz.
Tyler Vigen'in "Spurious Correlations" sitesinde komik örnekler vardır:
- "Margarine tüketimi" ile "Maine'de boşanma oranı" arasında korelasyon var (2000-2009).
- "Nicolas Cage filmlerinin sayısı" ile "havuzlarda boğulma vakaları" arasında .
Bunlar tabii ki rastlantı.
4) Seçim yanlılığı (selection bias)
Veri toplama yöntemi yanlı olabilir. Bir tıbbi araştırmada sadece hastaneye gelen insanlara bakarsanız (sağlıklılar hariç), bulgularınız genellenemez.
Tarihsel ünlü örnekler
"Stork bebek getirir" (1936)
İsveç istatistikçi: leylek sayısı ile yeni doğan bebek sayısı arasında pozitif korelasyon. Sebep: ikisi de kırsal alanlarda daha çok olur. Şehir-kır ayrımı (üçüncü değişken).
"Kahve içenler daha az kalp krizine yakalanır" (1980'ler)
Erken araştırmalar bu sonucu verdi. Ama sonradan: kahve içenler genellikle daha aktif, sosyal, sigara içmeyen kişilerdi. Kahve doğrudan etken değildi; yaşam tarzı ortak sebepti.
"Hormon replasman terapisi kalp koruyucudur" (1990'lar)
Gözlemsel çalışmalar bunu söylüyordu. Klinik deneyler (kontrollü randomize) yapıldığında ise tam tersi çıktı: HRT bazı durumlarda kalp riskini artırıyor. Önceki gözlemler seçim yanlılığından etkilenmişti.
Nedenselliği nasıl belirleriz?
Korelasyondan nedenselliğe geçmek zordur ama imkânsız değil. Yöntemler:
1) Randomize kontrollü deneyler (RCT)
İnsanları rastgele iki gruba ayırın: biri tedavi alır, diğeri plasebo. Korelasyon ortaya çıkarsa, nedensellik var.
Tıbbi araştırmaların altın standardı.
2) Doğal deneyler
Doğa veya tarihsel olay rastgele bir bölünme yaratır. Örnek: bir doğal afetin bir bölgeye etkisi (kontrol grubu: etkilenmeyen bölge).
3) Instrumental Variable (Aletsel değişken)
Ekonomi/sosyal bilimlerde: bağımsız değişken için dış bir "alet" kullanarak nedensellik çıkarma. Joshua Angrist ve Guido Imbens 2021 Nobel Ekonomi.
4) Causal inference (nedensel çıkarım)
Judea Pearl'in geliştirdiği modern teorik çerçeve. Nedensel grafikler, do-operatörü, karşıolgusal akıl yürütme.
Bradford Hill kriterleri
Tıp/epidemiyolojide nedensellik için 9 klasik kriter (Sir Austin Bradford Hill, 1965):
- Etkinin gücü: çok güçlü korelasyon nedensellik için iyidir.
- Tutarlılık: farklı çalışmalarda aynı sonuç.
- Özgüllük: tek bir sebep, tek bir sonuç.
- Zamansal sıra: sebep önce, sonuç sonra.
- Doz-cevap ilişkisi: daha fazla sebep, daha çok sonuç.
- Mantıklılık: bilimsel olarak makul mekanizma.
- Tutarlılık: önceki bilgiye uygun.
- Deneysel kanıt: kontrollü deneylerle.
- Analoji: benzer durumlarda da görülen.
Modern AI ve nedensellik
2010'lardan itibaren causal AI alanı patlama yaşadı. Makine öğrenmesi modelleri genellikle korelasyona dayanır; nedensellik için ek bilgi gerek.
Judea Pearl (Turing Ödülü 2011) "The Book of Why" eserinde modern AI'ın nedensellik anlamasının kritik olduğunu savunur.
Sağlık (ilaç etkisi), ekonomi (politika değerlendirmesi), sosyal bilim (toplumsal müdahale) — hepsinde nedensel düşünme gerekli.
Pratik dersler
1) "Birlikte değişiyor" ≠ "biri diğerine sebep"
İstatistiksel ilişki gördüğünüzde otomatik olarak nedensel ilişki çıkarmayın.
2) Üçüncü değişkenleri arayın
Hangi gizli faktör hem A hem B'yi etkilemiş olabilir?
3) Zaman sıralamasına bakın
A önce mi geldi, B sonra mı? Eğer B önce geliyorsa, A B'nin sebebi olamaz.
4) Mekanizma arayın
Nedensel iddianın arka planı mantıklı mı? Sigara akciğer kanserine yol açıyor — biyokimyasal mekanizma var. Margarine boşanma — yok.
5) Deneye güvenin (mümkünse)
Korelasyonel veri tek başına nedensellik kanıtlamaz. Mümkünse RCT yapın.
"İstatistik dili"
Bilimsel makalede doğru cümle:
"X ve Y arasında pozitif korelasyon gözlemlendi."
Yanlış cümle:
"X, Y'ye yol açar."
İlk cümle nettir; ikincisi veriden kanıt almadığı bir nedensellik iddiası'dır.
Bir cümlede
Modern bilim ve günlük yaşamın en yaygın hatalarından biri korelasyonu nedensellik sanmaktır. Bu, gazete manşetlerinden bilimsel makalelere, sosyal medyadan tıp uygulamalarına kadar her yerde karşımıza çıkar.
Dondurma boğulmaya yol açmaz. Yaz, ikisini de açıklar. Bu sıradan örneği akılda tutmak, modern dünyada "veriye dayalı düşünmenin" en güçlü zihinsel filtrelerinden biridir.
Bir istatistikçinin hayat boyu hatırlaması gereken cümle: "Korelasyon, nedensellik değildir."
Etiketler
Kendinizi Test Edin
Cevaplarınız profilinizde istatistik olarak saklanır.
1. Korelasyon ve nedensellik aynı şey midir?
2. Dondurma satışları ile boğulma vakaları arasındaki ilişki nasıl açıklanır?
3. Sahte korelasyon türlerinden biri NEDİR?
4. Nedensellik belirlemek için bilimsel olarak en güvenilir yöntem hangisidir?
5. Pearson korelasyon katsayısı $r$ hangi aralıkta değer alır ve neyi ölçer?
İlgili Yazılar
Sekreter Problemi: Hayatın En İyi Seçimini Yapmak için "%37 Kuralı"
Bir işe alma görüşmesi, bir ev arama süreci, hatta hayat arkadaşı seçimi… Hepsinin altında aynı klasik matematik problemi yatar. Cevap şaşırtıcı biçimde tek bir sayıya bağlıdır: %37.
MatematikPisagor Teoremi ve Saklı Bir Sır: İrrasyonel Sayılar Nasıl Keşfedildi?
Dik üçgenlerle ilgili o ünlü kural, aynı zamanda matematik tarihinin en sarsıcı keşfine yol açtı: kesir olarak yazılamayan sayılar. Üstelik bu keşif, bir bilim topluluğunu temellerinden sarstı.
MatematikFibonacci Dizisi ve Altın Oran: Tavşanlardan Ayçiçeklerine Uzanan Örüntü
Bir tavşan üretme bilmecesiyle başlayan basit bir sayı dizisi, ayçiçeği tohumlarından çam kozalaklarına, deniz kabuklarından galaksilere kadar doğanın her yerinde nasıl karşımıza çıkıyor?