Jordan Hoffmann: Chinchilla Makalesinin Baş Yazarı
DeepMind'da scaling laws düzeltmesini yapan, modern LLM ekonomisinin kuralını yeniden yazan araştırmacı.

Modern LLM ekonomisinin kuralını değiştiren
Mart 2022. DeepMind'in Chinchilla makalesi. 400+ farklı model deney. Sonuç: GPT-3 aşırı büyük + az veri ile eğitilmiş.
Bu basit bulgu modern LLM ekonomisini değiştirdi. Llama, Mistral, DeepSeek — hepsi Chinchilla'nın izinde.
Makalenin baş yazarı: Jordan Hoffmann. O dönem DeepMind'da kıdemli araştırmacı.
Akademik kökeni
Hoffmann Kanada'da yetişti. McGill Üniversitesi matematik ve fizik (2014). Sonra Princeton doktora.
Doktora konusu: hesaplamalı fizik ve makine öğrenmesi. Klasik bilim → AI yolu — Anandkumar, Hochreiter benzeri.
DeepMind (2019-2024)
Doktora sonrası DeepMind'a katıldı. Sayısız çalışma:
- Gopher (2021): 280B parametre model.
- RETRO (2022): Retrieval-augmented dil modeli.
- Chinchilla (2022): Modern LLM ekonomisinin kuralı.
- Sparrow (2022): Helpful + harmless chatbot.
Hoffmann'ın DeepMind dönemi çok üretkendi. Gopher → RETRO → Chinchilla hatı modern LLM araştırmasının baş izleri.
Mistral'e geçiş (2024)
2024'te Hoffmann Mistral'a katıldı. Bu transfer şaşırtıcıydı. Çoğu DeepMind araştırmacısı OpenAI veya Anthropic'e gider; Hoffmann Fransa'ya gitti.
Mistral'da rolü: Research scientist. Mensch ve Lample'in araştırma cephesini güçlendiren.
Bu transfer Avrupa AI bağımsızlığının somut örneği. DeepMind'in (Google) en parlak araştırmacılarından biri Fransa'ya geçti.
"Akademik dürüstlük"
Hoffmann'in Chinchilla makalesinin önemi sadece bulgu değil. OpenAI'in 2020 Kaplan scaling laws'una karşı akademik dürüst düzeltme.
Bu nadir bir tutum: rakip şirketin temel iddiasını bilimsel olarak çürütmek. Hem bilimsel hem politik akademik dürüstlük.
Modern AI'da bu tarz dürüst karşılıklı düzeltme nadir. Çoğu şirket kendi sonuçlarını över.
"Verim odağı"
Hoffmann'in akademik tarzı: verim optimization. "Aynı bütçe ile daha iyi sonuç nasıl?" sorusu.
Bu, modern AI'da kritik soru. ChatGPT pahalı, Llama 3 ucuz — fark Hoffmann tarzı düşünce.
Sade ders
Hoffmann hikâyesinden iki şey:
- Akademik dürüstlük endüstri değer yaratır. Hoffmann OpenAI'in iddiasını çürüttü; Meta bunu Llama'da uyguladı; modern AI ekonomisi farklı evrildi. Doğru bilim ekonomi yaratır.
- Avrupa AI talenti çekiyor. DeepMind'den Mistral'e geçiş Avrupa AI cephesi için sembolik. Tek ABD değil, Avrupa da talent çekiyor.
Bağlam
Chinchilla için: [[chinchilla-yasalari-veri-mi-parametre-mi]]. Scaling laws için: [[scaling-laws-yapay-zekayi-buyuk-yapmak-icin-matematik-formul]]. Mistral için: [[mistral-ai-avrupa-nin-open-source-cevabı]]. DeepMind için: [[demis-hassabis-deepmind-in-vizyoner-kurucusu]]. Mensch için: [[arthur-mensch-mistral-ai-nin-fransiz-kurucusu]].
Etiketler
Kendinizi Test Edin
Cevaplarınız profilinizde istatistik olarak saklanır.
1. Hoffmann'in akademik kökeni nedir?
2. DeepMind'daki büyük makaleleri nelerdir?
3. 2024'te nereye geçti?
4. Chinchilla makalesinin akademik önemi nedir?
5. Hoffmann'in akademik tarzı nasıl?
İlgili Yazılar
Brahmagupta: Sıfıra Kurallar Koyan ve Negatif Sayıları Borç Olarak Tanımlayan 7. Yüzyıl Hintlisi
628 yılında Brahmagupta, sıfırın aritmetiğini ve negatif sayıların kurallarını ilk kez sistematik biçimde yazdı. Borç-mülk metaforuyla negatif sayıları meşrulaştırdı, ikinci dereceden denklem formülünü genelleştirdi.
Bilim TarihiHypatia: İskenderiye'nin Son Büyük Kadın Matematikçisi ve Bir Çağın Sonu
M.S. 4. yüzyıl İskenderiye'sinde, dünyanın en büyük kütüphanesinin gölgesinde bir kadın geometri ve astronomi dersleri veriyordu. Hikâyesi, bir bilim insanının ötesinde, bir çağın bittiğini anlatır.
Bilim TarihiÉtienne Bézout: Fransız Donanmasının Matematik Hocası ve Adı Yanlış Yere Yapışmış Cebirci
Adı bugün her kriptografi dersinde geçen Bézout, hayatta sınava hazırlanan denizci adaylarına ders kitabı yazdı. Ünü, kendi bulmadığı bir teoremden geldi; kendi büyük teoremi ise nesiller boyunca anlaşılamadı.