Andrew Barto: Sutton'in Mentoru, Modern RL'in Kurucularından
Massachusetts Üniversitesi'nde Sutton'i ve Rich'in temellerini atan akademisyen, modern pekiştirmeli öğrenmenin akademik babası.

"Sutton'in mentoru"
Modern pekiştirmeli öğrenme dünyasında Sutton-Barto ikilisi standart referans. Sutton ön planda, ama temellerin önemli kısmı Andrew Barto tarafından kuruldu.
Barto, Sutton'in doktora danışmanı ve uzun yıllar boyunca ortağı oldu.
Akademik kökeni
Barto 1948 doğumlu. Michigan Üniversitesi'nde matematik. Sonra Michigan Üniversitesi'nde doktora (1975). Konusu: nörosibernetik ve adaptive control.
Bu klasik sibernetik gelenek: makine öğrenmesi öncesi, sinirbilim + kontrol teorisi sentezi.
1977'de Massachusetts Üniversitesi'ne profesör olarak katıldı. 40+ yıl orada kaldı.
Sutton'le çalışma — 1980'lerin başı
1978'de Sutton, Barto'nun yanına doktora için geldi. Modern pekiştirmeli öğrenmenin akademik temeli burada şekillendi.
Birlikte çalıştıkları konular:
- TD learning: Temporal Difference.
- Actor-critic methods: Politika + değer ayrı modeller.
- Adaptive heuristic critic: Klasik adaptive control + ML.
Bu çalışmalar 1980'lerde niş akademik konuydu. 2010'larda AlphaGo ve modern RL ile patladı.
"Reinforcement Learning: An Introduction" — ortak kitap
1998'de Sutton ve Barto birlikte modern RL'in standart ders kitabını yayımladı.
Bu kitap iki yazarın 30 yıllık çalışmasının özeti. Her bölüm matematik temellendirme + sezgi + pratik örnekler.
2018 ikinci baskısı modern RL'i (DQN, AlphaGo) kapsayacak şekilde güncellendi.
"Sessiz akademisyen"
Sutton modern medyada daha görünür. Barto sade akademik figür. Twitter'da yok, podcast yok.
Bu farklı profil özellikle:
- Sutton: makaleler, bloglar.
- Barto: kitap, akademik dersler.
Barto kuşak yetiştirmeye odaklı. UMass'ta düzinelerce doktora öğrencisi.
Akademik soyağacı
Barto'nun doktora öğrencileri:
- Rich Sutton: Modern RL'in baba figürü.
- Charles Anderson: Robotik RL.
- Satinder Singh: Hiyerarşik RL.
- Vijay Konda: Actor-critic.
Bu akademik nesil modern RL'in koridorlarını şekillendirdi.
"Klasik AI ile bağlantı"
Barto, klasik AI ile modern RL arasında köprü kuran az sayıda figürlerden:
- Klasik sibernetik + makine öğrenmesi.
- Adaptive control + Q-learning.
- Sinirbilim + algoritma.
Bu eski-yeni birleşim modern AI'da nadir. Çoğu modern araştırmacı sadece son 10 yıla bakar.
Sade ders
Barto hikâyesinden iki şey:
- Mentor etkisi makale etkisinden büyük olabilir. Barto Sutton'i yetiştirdi; Sutton modern RL'in baba figürü oldu. Bir öğrenci bir kuşağı dönüştürebilir.
- Klasik bilgi kıymetlidir. Barto'nun sibernetik geçmişi modern RL'in bazı kavramlarına temel sağlar. Eski disiplinler modern teknoloji ile birleşince güçlüdür.
Bağlam
Sutton için: [[rich-sutton-pekistirmeli-ogrenmenin-baba-figuru-ve-bitter-lesson]]. MDP ve RL temeli için: [[mdp-pekistirmeli-ogrenmenin-matematik-iskele]]. Modern RL uygulamaları için: [[john-schulman-ppo-nun-mucidi-rlhf-in-mimari]]. Pieter Abbeel için: [[pieter-abbeel-robotik-ve-pekistirmeli-ogrenmenin-pratik-yuzu]]. Mentor etkisi için: [[max-welling-hollanda-ai-akademisinin-baba-figuru]], [[christopher-re-stanford-veri-sistemleri-ve-foundation-models-mucidi]].
Etiketler
Kendinizi Test Edin
Cevaplarınız profilinizde istatistik olarak saklanır.
1. Barto'nun akademik kökeni nedir?
2. Sutton ile ilişkisi nedir?
3. TD learning kimleri etkiledi?
4. Barto'nun akademik tarzı nasıl?
5. Barto'nun öğrencileri kimler?
İlgili Yazılar
Brahmagupta: Sıfıra Kurallar Koyan ve Negatif Sayıları Borç Olarak Tanımlayan 7. Yüzyıl Hintlisi
628 yılında Brahmagupta, sıfırın aritmetiğini ve negatif sayıların kurallarını ilk kez sistematik biçimde yazdı. Borç-mülk metaforuyla negatif sayıları meşrulaştırdı, ikinci dereceden denklem formülünü genelleştirdi.
Bilim TarihiHypatia: İskenderiye'nin Son Büyük Kadın Matematikçisi ve Bir Çağın Sonu
M.S. 4. yüzyıl İskenderiye'sinde, dünyanın en büyük kütüphanesinin gölgesinde bir kadın geometri ve astronomi dersleri veriyordu. Hikâyesi, bir bilim insanının ötesinde, bir çağın bittiğini anlatır.
Bilim TarihiÉtienne Bézout: Fransız Donanmasının Matematik Hocası ve Adı Yanlış Yere Yapışmış Cebirci
Adı bugün her kriptografi dersinde geçen Bézout, hayatta sınava hazırlanan denizci adaylarına ders kitabı yazdı. Ünü, kendi bulmadığı bir teoremden geldi; kendi büyük teoremi ise nesiller boyunca anlaşılamadı.