Tüm yazılar
Bilim Tarihi26 Ocak 2025

Robert Tibshirani: Lasso'nun Mucidi, Modern İstatistiğin Stanford Yüzü

Lasso, bootstrap, ESL kitabı — Tibshirani modern uygulamalı istatistiğin yapı taşlarını döşedi.

Matematik Karavanı 5 dk okuma 5 soru
Veri analizi metaforu

"Veri seyrek olmalı"

Robert Tibshirani (d. 1956, Niagara Falls) — modern istatistik ve makine öğrenmesinin kesişim noktasındaki en etkili isimlerden. Lasso, bootstrap eğitimi, ESL ve ISLR kitapları.

Tek cümle: veri biliminin yapı taşlarını döşeyen Kanadalı istatistikçi.

Yol

  • University of Waterloo lisans — istatistik.
  • University of Toronto master.
  • Stanford doktora (1981) — Bradley Efron mentörlüğünde (bootstrap'in babası).
  • University of Toronto — uzun süreli profesörlük.
  • Stanford (1998-) — Department of Health Research and Policy, Statistics.

Lasso (1996)

Tibshirani'nin ana katkısı: Lasso (Least Absolute Shrinkage and Selection Operator) — L1 düzenlileştirme:

minwyXw2+λw1\min_w \|y - Xw\|^2 + \lambda \|w\|_1

Klasik regresyona w|w| cezası ekle. Sonuç: çoğu katsayı tam sıfır olur. Yani Lasso aynı anda:

  • Regresyon yapar.
  • Özellik seçer (otomatik).

Bu, yüksek boyutlu istatistiğin başlangıcıdır. Genetik, metin sınıflandırma, biyoinformatik — Lasso her yerde.

Kitaplar

"The Elements of Statistical Learning" (ESL, 2001)

Hastie ve Friedman ile birlikte yazdığı kitap. Modern ML'in incil'i. 2009'da güncellenen 2. baskı.

  • Linear methods, kernel methods, tree-based, ensemble, deep learning.
  • Akademik standart. Stanford CS229, MIT 6.867 gibi derslerin temel kaynağı.

"An Introduction to Statistical Learning" (ISLR, 2013)

Hastie, Witten, James ile. ESL'in giriş seviyesi. R ve Python uygulamaları içeren versiyonu da yayında.

Modern data science öğrencilerinin ilk kitabı.

Bootstrap eğitimi

Mentörü Bradley Efron'un 1979 bootstrap fikrini yayınlamak ve genelleştirmekde Tibshirani'nin payı büyük:

  • "An Introduction to the Bootstrap" (1993, Efron ile).
  • Bootstrap CI, bias correction, vs.

Modern istatistiksel hesaplamanın temel aracı oldu.

Diğer katkıları

  • GAM (Generalized Additive Models, Hastie ile) — doğrusal modelin esnek genelleştirmesi.
  • SAM (Significance Analysis of Microarrays) — bio çoklu test düzeltmesi.
  • Sparse PCA, sparse canonical correlation.
  • Glmnet R paketi — Lasso ve elastic net için fact standart araç.

Onurlar

  • COPSS Presidents' Award (1996) — 40 yaş altı en iyi istatistikçiye.
  • Royal Society of Canada üyesi.
  • Member of National Academy of Sciences (US).

Tarz

  • Sade, açık yazar — ESL kitabı anlaşılabilir matematik standardı.
  • Pratik öncelikli: her teorinin çalışan kod karşılığı olmalı.
  • R'nin savunucusu — modern istatistiğin programlama dili.

Türk istatistik ve veri bilimi

  • ESL ve ISLR Türk üniversitelerinde standart referans.
  • Lasso, Hacettepe-İstanbul biyoistatistik tezlerinde sık görülür.
  • ODTÜ, Boğaziçi data science derslerinde glmnet standart araç.

"İki kültür" tartışması

Breiman'in 2001 "iki kültür" makalesinde:

  • Stokastik modelleme (klasik istatistik).
  • Algoritmik modelleme (ML).

Tibshirani ikisinin arasında köprü — Lasso bunun simgesi: hem istatistiksel teori (sparse recovery) hem ML pratiği (otomatik özellik seçimi).

Kapanış

Robert Tibshirani, modern veri biliminin görünmez mimarlarından. Lasso günümüzde her yerde, ESL hâlâ standart, glmnet hâlâ kullanılıyor. Tibshirani şöhret değil etki seçti — sonuç: bilim tarihinde sessiz ama derin yer.

Etiketler

Robert TibshiraniLassoESLStanfordistatistik

Kendinizi Test Edin

Cevaplarınız profilinizde istatistik olarak saklanır.

1. Lasso ne yapar?

2. Mentörü?

3. ESL kitabı?

4. Glmnet ne?

5. Kanada bağlantısı?