Tüm yazılar
Matematik7 Ocak 2025

Hierarchik Modeller: Bayesçi İstatistiğin "Asma Zinciri"

Bir okulun her sınıfı, bir hastanenin her kliniği, bir ülkenin her ili — veri çoğu zaman gruplara iç içe. Hierarşik modelleme bu yapıyı doğru ele alıyor.

Matematik Karavanı 6 dk okuma 5 soru
Site hiyerarşi diyagramı — multilevel model metaforu

Veri her zaman düz değildir

Klasik istatistik modelleri genelde bağımsız gözlem varsayar. Ama gerçek dünya:

  • Öğrenciler sınıflara, sınıflar okullara ait.
  • Hastalar hastanelere, hastaneler illere ait.
  • Müşteriler mağazalara, mağazalar zincirlere ait.

Gözlemler bağımsız değil — aynı grup içinde benzer.

Çözüm: hierarşik (multilevel) modeller.

Üç yaklaşım

Diyelim 10 okuldan öğrenci sınavı analiz ediyoruz.

1. Complete pooling

Tüm öğrencileri birlikte modelle. Okul farkını yok say.

  • Avantaj: çok veri, az parametre.
  • Dezavantaj: okul farklarını ihmal eder.

2. No pooling

Her okul için ayrı model.

  • Avantaj: her okula özgü.
  • Dezavantaj: küçük okullar için çok az veri, overfitting.

3. Partial pooling (hierarşik)

Her okul kendi etkisi var ama hepsi bir ortak dağılımdan.

  • En iyisi: küçük okullar büyüklerden "borç alır", her okul kendine has.

Matematik

\
yijN(αj+βxij,σ2)y_{ij} \sim \mathcal{N}(\alpha_j + \beta x_{ij}, \sigma^2)

αjN(μα,σα2)\alpha_j \sim \mathcal{N}(\mu_\alpha, \sigma_\alpha^2)
\

  • yijy_{ij}: jj okulundaki ii öğrencisinin skoru.
  • αj\alpha_j: jj okulunun intercept'i.
  • μα,σα2\mu_\alpha, \sigma_\alpha^2: okul interceptlerinin dağılımı.

Hyperprior (μ,σ\mu, \sigma) ile her okul tahminini birbirine "çeker".

Shrinkage (büzme)

Bireysel okul tahmini, global ortalamaya çekilir.

  • Çok veri olan okul → kendi tahminine yakın.
  • Az veri olan okul → global ortalamaya yakın.

Bu klasik istatistikten farklı: Stein's paradox gösterdi ki, 3+ grup için shrinkage mutlaka daha iyi.

Pratik örnekler

Eğitim

8 schools study (Rubin, 1981):
8 farklı okulda SAT prep kursunun etkisi.

  • No pooling: 8 ayrı tahmin (gürültülü).
  • Complete: 1 ortalama (okul farklarını yok eder).
  • Hierarşik: 8 yumuşatılmış tahmin → en iyi karar verme.

Tıp

Çoklu hastane çalışması:

  • Bireysel hastane etkisi: αh\alpha_h.
  • Hastaneler arası varyasyon: σh\sigma_h.
  • Tedavi etkisi: β\beta.

Spor

Beysbol oyuncu performansı.

  • 50 atışta .400 vurmuş oyuncu gerçekten .400 mü? Hayır → shrinkage ile gerçek tahminin .300'e yakın.

Modern AI bağlantısı

Meta-learning: birçok görev → her görev için model → tüm görevlerin ortak dağılımı.

Mixed-effects neural networks: grup intercept'leri sinir ağına ekle.

Personalized recommendations: her kullanıcı için ortak prior'dan örnek.

Federated learning: cihaz başına model + global prior. Klasik hierarşik mantık.

Frequentist versiyonu: Mixed Effects Models

\
yij=Xijβ+Zijuj+ϵijy_{ij} = X_{ij}\beta + Z_{ij} u_j + \epsilon_{ij}
\

  • β\beta: fixed effects (tüm gruplar için aynı).
  • uju_j: random effects (gruba özgü, dağılımdan).

R'da lme4 paketi (Doug Bates), Python'da statsmodels standart.

Stan örneği

parameters {
  real mu_alpha;
  real<lower=0> sigma_alpha;
  vector[J] alpha;
  real beta;
  real<lower=0> sigma;
}
model {
  alpha ~ normal(mu_alpha, sigma_alpha);
  y ~ normal(alpha[school] + beta * x, sigma);
}

Avantajları

  • Az veri olan grupları kurtarır (shrinkage).
  • Belirsizlik doğru iletilir.
  • Çoklu seviye doğal: öğrenci → sınıf → okul → il.
  • Eksik veri kolay (Bayesçi MAR).

Dezavantajlar

  • Hesap maliyeti: MCMC yavaş olabilir.
  • Konverj zorluğu: çok seviyeli modeller hassas.
  • Yorumlanabilirlik: çoklu varyans bileşeni karmaşık.
  • Hyperprior seçimi: önemli, hassas.

Modern alternatifler

  • brms (R): kolay Bayes mixed model.
  • PyMC: Python Bayes.
  • TensorFlow Probability: derin öğrenme ile Bayes.
  • NumPyro: JAX tabanlı, hızlı.

Türk araştırmaları

  • Eğitim: PISA verisi okul-il-ülke seviyeleri.
  • Sağlık: COVID hastane-il çalışmaları.
  • Tarım: bölge-il-çiftlik verim modelleri.
  • Sosyal: TÜİK haneler-il anketleri.

Felsefe

Hierarchik model gerçek dünyaya uyumdur. Veri düz değil; grupları yok saymak bilgi kaybıdır.

Gelman'ın temel mesajı: her gerçek veri seti multilevel.

Kapanış

Hierarşik modeller modern istatistiğin en güçlü aracı. Az veri kurtarır, doğru belirsizlik verir, gerçek dünya yapısını yansıtır. Bayesçi yaklaşımın şah eseri.

Bir veri biliminin olgunluk işareti: complete pooling'i bırakıp partial pooling'e geçmek.

Etiketler

hierarchical modelmultilevel modelmixed effectsBayesçi istatistikpartial pooling

Kendinizi Test Edin

Cevaplarınız profilinizde istatistik olarak saklanır.

1. Partial pooling ne yapar?

2. Stein's paradox?

3. Frequentist karşılığı?

4. Modern AI bağlantısı?

5. 8 schools study kimin?