Tüm yazılar
Matematik22 Eylül 2025

Korelasyon ve Nedensellik: Dondurma Boğulma Nedeni mi?

Yazın dondurma satışları artar; aynı yaz boğulma vakaları artar. Dondurma boğulmaya mı yol açıyor? Hayır — ortak sebep var: sıcak hava. İstatistikteki en sık karıştırılan iki kavram.

Matematik Karavanı Editörü 7 dk okuma 5 soru
Plajda dondurma yenilirken yaz manzarası

Dondurma ve boğulma vakaları

Bir istatistikçi şu veriyi paylaşıyor:

"Dondurma satışları arttıkça boğulma vakaları artar. İkisi arasında güçlü pozitif korelasyon var."

Sezgisel okuma: "Dondurma yiyenler boğuluyor!"

Yanlış. Ortak bir üçüncü sebep var: sıcak hava (yaz). Yazın hem dondurma yenilir, hem insanlar denize girer, hem boğulma vakaları artar. Dondurma ile boğulma arasında gerçek nedensel bağ yok — sadece görünüşte ilişki.

Bu, modern istatistikteki en büyük tuzaklardan biri: korelasyon ≠ nedensellik.

Korelasyon nedir?

İki değişken arasındaki doğrusal ilişkinin sayısal ölçüsü.

Pearson korelasyon katsayısı:

r=(xixˉ)(yiyˉ)(xixˉ)2(yiyˉ)2r = \frac{\sum (x_i - \bar x)(y_i - \bar y)}{\sqrt{\sum (x_i - \bar x)^2 \sum (y_i - \bar y)^2}}

rr değeri 1-1 ile +1+1 arasında:

  • r=+1r = +1: mükemmel pozitif doğrusal ilişki.
  • r=0r = 0: doğrusal ilişki yok.
  • r=1r = -1: mükemmel negatif doğrusal ilişki.

(Cauchy-Schwarz eşitsizliği r1|r| \leq 1'i garantiler.)

Korelasyon türleri

Pozitif korelasyon

İki değişken aynı yönde hareket eder. Örnek: boy ile kilo.

Negatif korelasyon

Ters yönde. Örnek: sigara içme ile akciğer kapasitesi.

Sıfır korelasyon

Doğrusal ilişki yok — ama doğrusal olmayan ilişki olabilir (örn. y=x2y = x^2 verisi).

Nedensellik nedir?

A nedeni B'ye yol açar demek. A değişirse, B değişir; A olmasaydı, B olmazdı.

Korelasyon istatistiksel'dir; nedensellik ontolojik. İkisi farklı.

4 sahte korelasyon tipi

1) Ortak sebep (confounding)

Yukarıdaki dondurma örneği. Üçüncü değişken (sıcaklık) hem A'yı hem B'yi etkiliyor; A ve B arasında doğrudan bağ yok.

Klasik örnek: "İtfaiyeci sayısı ile yangın hasarı arasında pozitif korelasyon vardır." Sebebi: büyük yangınlarda hem itfaiyeci hem hasar çok. İtfaiyeciler yangını yapmıyor!

2) Ters nedensellik

A → B sandığımız ilişkide aslında B → A vardır.

Örnek: "Mutlu insanlar daha az sigara içer." Sebep-sonuç hangisi? Mutluluk azaltıyor mu sigara içmeyi? Sigara azaltmak mutluluk getiriyor mu? Veya başka faktör?

3) Tesadüfi korelasyon

Pür şans. Yeterince çok değişken karşılaştırırsanız, tesadüfen korelasyon bulursunuz.

Tyler Vigen'in "Spurious Correlations" sitesinde komik örnekler vardır:

  • "Margarine tüketimi" ile "Maine'de boşanma oranı" arasında r=0.99r = 0.99 korelasyon var (2000-2009).
  • "Nicolas Cage filmlerinin sayısı" ile "havuzlarda boğulma vakaları" arasında r=0.66r = 0.66.

Bunlar tabii ki rastlantı.

4) Seçim yanlılığı (selection bias)

Veri toplama yöntemi yanlı olabilir. Bir tıbbi araştırmada sadece hastaneye gelen insanlara bakarsanız (sağlıklılar hariç), bulgularınız genellenemez.

Tarihsel ünlü örnekler

"Stork bebek getirir" (1936)

İsveç istatistikçi: leylek sayısı ile yeni doğan bebek sayısı arasında pozitif korelasyon. Sebep: ikisi de kırsal alanlarda daha çok olur. Şehir-kır ayrımı (üçüncü değişken).

"Kahve içenler daha az kalp krizine yakalanır" (1980'ler)

Erken araştırmalar bu sonucu verdi. Ama sonradan: kahve içenler genellikle daha aktif, sosyal, sigara içmeyen kişilerdi. Kahve doğrudan etken değildi; yaşam tarzı ortak sebepti.

"Hormon replasman terapisi kalp koruyucudur" (1990'lar)

Gözlemsel çalışmalar bunu söylüyordu. Klinik deneyler (kontrollü randomize) yapıldığında ise tam tersi çıktı: HRT bazı durumlarda kalp riskini artırıyor. Önceki gözlemler seçim yanlılığından etkilenmişti.

Nedenselliği nasıl belirleriz?

Korelasyondan nedenselliğe geçmek zordur ama imkânsız değil. Yöntemler:

1) Randomize kontrollü deneyler (RCT)

İnsanları rastgele iki gruba ayırın: biri tedavi alır, diğeri plasebo. Korelasyon ortaya çıkarsa, nedensellik var.

Tıbbi araştırmaların altın standardı.

2) Doğal deneyler

Doğa veya tarihsel olay rastgele bir bölünme yaratır. Örnek: bir doğal afetin bir bölgeye etkisi (kontrol grubu: etkilenmeyen bölge).

3) Instrumental Variable (Aletsel değişken)

Ekonomi/sosyal bilimlerde: bağımsız değişken için dış bir "alet" kullanarak nedensellik çıkarma. Joshua Angrist ve Guido Imbens 2021 Nobel Ekonomi.

4) Causal inference (nedensel çıkarım)

Judea Pearl'in geliştirdiği modern teorik çerçeve. Nedensel grafikler, do-operatörü, karşıolgusal akıl yürütme.

Bradford Hill kriterleri

Tıp/epidemiyolojide nedensellik için 9 klasik kriter (Sir Austin Bradford Hill, 1965):

  1. Etkinin gücü: çok güçlü korelasyon nedensellik için iyidir.
  2. Tutarlılık: farklı çalışmalarda aynı sonuç.
  3. Özgüllük: tek bir sebep, tek bir sonuç.
  4. Zamansal sıra: sebep önce, sonuç sonra.
  5. Doz-cevap ilişkisi: daha fazla sebep, daha çok sonuç.
  6. Mantıklılık: bilimsel olarak makul mekanizma.
  7. Tutarlılık: önceki bilgiye uygun.
  8. Deneysel kanıt: kontrollü deneylerle.
  9. Analoji: benzer durumlarda da görülen.

Modern AI ve nedensellik

2010'lardan itibaren causal AI alanı patlama yaşadı. Makine öğrenmesi modelleri genellikle korelasyona dayanır; nedensellik için ek bilgi gerek.

Judea Pearl (Turing Ödülü 2011) "The Book of Why" eserinde modern AI'ın nedensellik anlamasının kritik olduğunu savunur.

Sağlık (ilaç etkisi), ekonomi (politika değerlendirmesi), sosyal bilim (toplumsal müdahale) — hepsinde nedensel düşünme gerekli.

Pratik dersler

1) "Birlikte değişiyor" ≠ "biri diğerine sebep"

İstatistiksel ilişki gördüğünüzde otomatik olarak nedensel ilişki çıkarmayın.

2) Üçüncü değişkenleri arayın

Hangi gizli faktör hem A hem B'yi etkilemiş olabilir?

3) Zaman sıralamasına bakın

A önce mi geldi, B sonra mı? Eğer B önce geliyorsa, A B'nin sebebi olamaz.

4) Mekanizma arayın

Nedensel iddianın arka planı mantıklı mı? Sigara akciğer kanserine yol açıyor — biyokimyasal mekanizma var. Margarine boşanma — yok.

5) Deneye güvenin (mümkünse)

Korelasyonel veri tek başına nedensellik kanıtlamaz. Mümkünse RCT yapın.

"İstatistik dili"

Bilimsel makalede doğru cümle:

"X ve Y arasında pozitif korelasyon gözlemlendi."

Yanlış cümle:

"X, Y'ye yol açar."

İlk cümle nettir; ikincisi veriden kanıt almadığı bir nedensellik iddiası'dır.

Bir cümlede

Modern bilim ve günlük yaşamın en yaygın hatalarından biri korelasyonu nedensellik sanmaktır. Bu, gazete manşetlerinden bilimsel makalelere, sosyal medyadan tıp uygulamalarına kadar her yerde karşımıza çıkar.

Dondurma boğulmaya yol açmaz. Yaz, ikisini de açıklar. Bu sıradan örneği akılda tutmak, modern dünyada "veriye dayalı düşünmenin" en güçlü zihinsel filtrelerinden biridir.

Bir istatistikçinin hayat boyu hatırlaması gereken cümle: "Korelasyon, nedensellik değildir."

Etiketler

korelasyonnedensellikistatistikpearsonbilim metodolojisi

Kendinizi Test Edin

Cevaplarınız profilinizde istatistik olarak saklanır.

1. Korelasyon ve nedensellik aynı şey midir?

2. Dondurma satışları ile boğulma vakaları arasındaki ilişki nasıl açıklanır?

3. Sahte korelasyon türlerinden biri NEDİR?

4. Nedensellik belirlemek için bilimsel olarak en güvenilir yöntem hangisidir?

5. Pearson korelasyon katsayısı $r$ hangi aralıkta değer alır ve neyi ölçer?