Hierarchik Modeller: Bayesçi İstatistiğin "Asma Zinciri"
Bir okulun her sınıfı, bir hastanenin her kliniği, bir ülkenin her ili — veri çoğu zaman gruplara iç içe. Hierarşik modelleme bu yapıyı doğru ele alıyor.

Veri her zaman düz değildir
Klasik istatistik modelleri genelde bağımsız gözlem varsayar. Ama gerçek dünya:
- Öğrenciler sınıflara, sınıflar okullara ait.
- Hastalar hastanelere, hastaneler illere ait.
- Müşteriler mağazalara, mağazalar zincirlere ait.
Gözlemler bağımsız değil — aynı grup içinde benzer.
Çözüm: hierarşik (multilevel) modeller.
Üç yaklaşım
Diyelim 10 okuldan öğrenci sınavı analiz ediyoruz.
1. Complete pooling
Tüm öğrencileri birlikte modelle. Okul farkını yok say.
- Avantaj: çok veri, az parametre.
- Dezavantaj: okul farklarını ihmal eder.
2. No pooling
Her okul için ayrı model.
- Avantaj: her okula özgü.
- Dezavantaj: küçük okullar için çok az veri, overfitting.
3. Partial pooling (hierarşik)
Her okul kendi etkisi var ama hepsi bir ortak dağılımdan.
- En iyisi: küçük okullar büyüklerden "borç alır", her okul kendine has.
Matematik
\
\
- : okulundaki öğrencisinin skoru.
- : okulunun intercept'i.
- : okul interceptlerinin dağılımı.
Hyperprior () ile her okul tahminini birbirine "çeker".
Shrinkage (büzme)
Bireysel okul tahmini, global ortalamaya çekilir.
- Çok veri olan okul → kendi tahminine yakın.
- Az veri olan okul → global ortalamaya yakın.
Bu klasik istatistikten farklı: Stein's paradox gösterdi ki, 3+ grup için shrinkage mutlaka daha iyi.
Pratik örnekler
Eğitim
8 schools study (Rubin, 1981):
8 farklı okulda SAT prep kursunun etkisi.
- No pooling: 8 ayrı tahmin (gürültülü).
- Complete: 1 ortalama (okul farklarını yok eder).
- Hierarşik: 8 yumuşatılmış tahmin → en iyi karar verme.
Tıp
Çoklu hastane çalışması:
- Bireysel hastane etkisi: .
- Hastaneler arası varyasyon: .
- Tedavi etkisi: .
Spor
Beysbol oyuncu performansı.
- 50 atışta .400 vurmuş oyuncu gerçekten .400 mü? Hayır → shrinkage ile gerçek tahminin .300'e yakın.
Modern AI bağlantısı
Meta-learning: birçok görev → her görev için model → tüm görevlerin ortak dağılımı.
Mixed-effects neural networks: grup intercept'leri sinir ağına ekle.
Personalized recommendations: her kullanıcı için ortak prior'dan örnek.
Federated learning: cihaz başına model + global prior. Klasik hierarşik mantık.
Frequentist versiyonu: Mixed Effects Models
\
\
- : fixed effects (tüm gruplar için aynı).
- : random effects (gruba özgü, dağılımdan).
R'da lme4 paketi (Doug Bates), Python'da statsmodels standart.
Stan örneği
parameters {
real mu_alpha;
real<lower=0> sigma_alpha;
vector[J] alpha;
real beta;
real<lower=0> sigma;
}
model {
alpha ~ normal(mu_alpha, sigma_alpha);
y ~ normal(alpha[school] + beta * x, sigma);
}
Avantajları
- Az veri olan grupları kurtarır (shrinkage).
- Belirsizlik doğru iletilir.
- Çoklu seviye doğal: öğrenci → sınıf → okul → il.
- Eksik veri kolay (Bayesçi MAR).
Dezavantajlar
- Hesap maliyeti: MCMC yavaş olabilir.
- Konverj zorluğu: çok seviyeli modeller hassas.
- Yorumlanabilirlik: çoklu varyans bileşeni karmaşık.
- Hyperprior seçimi: önemli, hassas.
Modern alternatifler
- brms (R): kolay Bayes mixed model.
- PyMC: Python Bayes.
- TensorFlow Probability: derin öğrenme ile Bayes.
- NumPyro: JAX tabanlı, hızlı.
Türk araştırmaları
- Eğitim: PISA verisi okul-il-ülke seviyeleri.
- Sağlık: COVID hastane-il çalışmaları.
- Tarım: bölge-il-çiftlik verim modelleri.
- Sosyal: TÜİK haneler-il anketleri.
Felsefe
Hierarchik model gerçek dünyaya uyumdur. Veri düz değil; grupları yok saymak bilgi kaybıdır.
Gelman'ın temel mesajı: her gerçek veri seti multilevel.
Kapanış
Hierarşik modeller modern istatistiğin en güçlü aracı. Az veri kurtarır, doğru belirsizlik verir, gerçek dünya yapısını yansıtır. Bayesçi yaklaşımın şah eseri.
Bir veri biliminin olgunluk işareti: complete pooling'i bırakıp partial pooling'e geçmek.
Etiketler
Kendinizi Test Edin
Cevaplarınız profilinizde istatistik olarak saklanır.
1. Partial pooling ne yapar?
2. Stein's paradox?
3. Frequentist karşılığı?
4. Modern AI bağlantısı?
5. 8 schools study kimin?
İlgili Yazılar
Sekreter Problemi: Hayatın En İyi Seçimini Yapmak için "%37 Kuralı"
Bir işe alma görüşmesi, bir ev arama süreci, hatta hayat arkadaşı seçimi… Hepsinin altında aynı klasik matematik problemi yatar. Cevap şaşırtıcı biçimde tek bir sayıya bağlıdır: %37.
MatematikPisagor Teoremi ve Saklı Bir Sır: İrrasyonel Sayılar Nasıl Keşfedildi?
Dik üçgenlerle ilgili o ünlü kural, aynı zamanda matematik tarihinin en sarsıcı keşfine yol açtı: kesir olarak yazılamayan sayılar. Üstelik bu keşif, bir bilim topluluğunu temellerinden sarstı.
MatematikFibonacci Dizisi ve Altın Oran: Tavşanlardan Ayçiçeklerine Uzanan Örüntü
Bir tavşan üretme bilmecesiyle başlayan basit bir sayı dizisi, ayçiçeği tohumlarından çam kozalaklarına, deniz kabuklarından galaksilere kadar doğanın her yerinde nasıl karşımıza çıkıyor?