Tüm yazılar
Bilim Tarihi12 Ocak 2025

Hadley Wickham: Tidyverse ile R'ı Modern Data Science'a Taşıyan Yeni Zelandalı

dplyr, ggplot2, tidyr — Wickham'ın yazdığı R paketleri bir kuşak veri bilimcinin günlük araçları oldu.

Matematik Karavanı 5 dk okuma 5 soru
Programlama kodu — R tidyverse metaforu

"R'ı sevilebilir yaptı"

Hadley Wickham (d. 1979, Yeni Zelanda) — modern R'ın bir bakıma kurucusu. Klasik R çirkin ve zorduysa, tidyverse sayesinde temiz, okunabilir, hızlı.

Tek cümle: yazılım mühendisliği felsefesini istatistiğe getirdi.

Yol

  • University of Auckland lisans — istatistik.
  • Iowa State University doktora (2008) — istatistik, görselleştirme.
  • Rice University asistan profesörü (2009-2013).
  • RStudio (şimdi Posit) baş bilim insanı (2013-).
  • Yeni Zelanda Royal Society üyesi.

Anahtar paketler

ggplot2 (2005)

Doktora tezi: "The Grammar of Graphics" (Wilkinson 2005) felsefesini R'a getir.

Grammar of Graphics: bir grafik = veri + estetik + geometri + istatistik + koordinat + tema.

ggplot(mtcars, aes(x = mpg, y = hp)) +
  geom_point() +
  geom_smooth() +
  theme_minimal()

Sonuç: temiz, modüler, güzel grafikler. R'ın base plot'unun yerini aldı.

dplyr (2014)

Veri manipülasyonu:

  • filter(): satır seç.
  • select(): sütun seç.
  • mutate(): yeni sütun.
  • summarize(): özetle.
  • group_by(): gruplama.
  • %>% pipe operatörü.

Python pandas'ın alternatifi, hatta okunabilirlik açısından üstünü.

tidyr (2014)

Veri temizleme: long-wide formatları, eksik veri.

pivot_longer(), pivot_wider() — modern data wrangling.

purrr, readr, stringr, lubridate, forcats

Her biri belirli bir görev: fonksiyonel programlama, okuma, metin, tarih, faktör.

Tidyverse umbrella

library(tidyverse) → tüm aile tek seferde.

"Tidy data" felsefesi

Wickham 2014 makalesi: "Tidy Data".

İyi veri:

  1. Her değişken bir sütun.
  2. Her gözlem bir satır.
  3. Her tür gözlem bir tablo.

Bu felsefe Türkiye'de bile data science derslerinin başlangıcı oldu. SQL'in 3NF'ye benzer ama veri analizine optimize.

Akademik etki

  • 20.000+ Google Scholar alıntı.
  • Yenilikçi açık kaynak yazılım.
  • Eğitim: "R for Data Science" kitabı ücretsiz, 30+ dile çeviri.
  • JSS (Journal of Statistical Software) editörü olmuş.

Posit / RStudio

RStudio (2011) — R için IDE. Wickham erken katılım. 2022 şirket Posit oldu ve Python desteğini de ekledi.

Tidyverse'in Python karşılığı: siuba, dfply — ama hâlâ pandas hakim.

Tarz

  • Açık kaynak öncelik: hep ücretsiz.
  • Topluluk öncelik: RStudio Conf, useR konferansları.
  • Pedagojik: her paketin mükemmel dokümantasyonu.
  • Yazılım mühendisliği: testler, semver, CI/CD.

R vs Python tartışması

Bilim dünyasında:

  • R: istatistik, akademi, biyoinformatik.
  • Python: ML, web, üretim.

Hadley'in pozisyonu: dil önemli değil, fikirler önemli. Tidyverse felsefesi Python'a da aktarılıyor.

Türk akademisyenler için

  • ODTÜ, Hacettepe, Boğaziçi istatistik bölümlerinde tidyverse standart.
  • R for Data Science Türkçe çeviri çalışmaları var.
  • TÜİK ve TCMB analistleri R + tidyverse kullanıyor.

Felsefe

Hadley'nin tekrarladığı: "Kullanıcı için tasarlayın".

Klasik R istatistikçiler için istatistikçiler tarafından yazıldı. Tidyverse veri ile çalışan herkese açık.

Ödüller

  • 2013 Donald T. Campbell Award.
  • 2019 COPSS Presidents' Award.
  • Foreign Honorary Member, American Academy of Arts and Sciences.

Kapanış

Hadley Wickham, modern R'ın mimar mühendisidir. Tidyverse olmasaydı R çok önce ölmüş olabilirdi. Onun çabası sayesinde istatistik ve veri analizi çok daha geniş kitlelere erişti. Açık kaynak topluluğunun örnek figürü.

Etiketler

Hadley WickhamRtidyverseggplot2data science

Kendinizi Test Edin

Cevaplarınız profilinizde istatistik olarak saklanır.

1. Tidyverse nedir?

2. ggplot2'nin felsefesi?

3. Tidy data 3 kuralı?

4. Çalıştığı şirket?

5. Memleketi?