Hoffmann'in akademik kökeni nedir?

McGill matematik/fizik + Princeton PhD (hesaplamalı fizik + ML)

DeepMind'daki büyük makaleleri nelerdir?

Gopher (2021), RETRO (2022), Chinchilla (2022), Sparrow (2022)

2024'te nereye geçti?

DeepMind'dan Mistral'a — Avrupa AI cephesi sembolik

Chinchilla makalesinin akademik önemi nedir?

OpenAI Kaplan iddiasının bilimsel düzeltmesi — akademik dürüstlük

Hoffmann'in akademik tarzı nasıl?

Verim odağı — "aynı bütçe, daha iyi sonuç nasıl?"

Jordan Hoffmann: Chinchilla Makalesinin Baş Yazarı

Modern LLM ekonomisinin kuralını değiştiren

Mart 2022. DeepMind'in Chinchilla makalesi. 400+ farklı model deney. Sonuç: GPT-3 aşırı büyük + az veri ile eğitilmiş.

Bu basit bulgu modern LLM ekonomisini değiştirdi. Llama, Mistral, DeepSeek — hepsi Chinchilla'nın izinde.

Makalenin baş yazarı: Jordan Hoffmann. O dönem DeepMind'da kıdemli araştırmacı.

Akademik kökeni

Hoffmann Kanada'da yetişti. McGill Üniversitesi matematik ve fizik (2014). Sonra Princeton doktora.

Doktora konusu: hesaplamalı fizik ve makine öğrenmesi. Klasik bilim → AI yolu — Anandkumar, Hochreiter benzeri.

DeepMind (2019-2024)

Doktora sonrası DeepMind'a katıldı. Sayısız çalışma:

Gopher (2021): 280B parametre model.
RETRO (2022): Retrieval-augmented dil modeli.
Chinchilla (2022): Modern LLM ekonomisinin kuralı.
Sparrow (2022): Helpful + harmless chatbot.

Hoffmann'ın DeepMind dönemi çok üretkendi. Gopher → RETRO → Chinchilla hatı modern LLM araştırmasının baş izleri.

Mistral'e geçiş (2024)

2024'te Hoffmann Mistral'a katıldı. Bu transfer şaşırtıcıydı. Çoğu DeepMind araştırmacısı OpenAI veya Anthropic'e gider; Hoffmann Fransa'ya gitti.

Mistral'da rolü: Research scientist. Mensch ve Lample'in araştırma cephesini güçlendiren.

Bu transfer Avrupa AI bağımsızlığının somut örneği. DeepMind'in (Google) en parlak araştırmacılarından biri Fransa'ya geçti.

"Akademik dürüstlük"

Hoffmann'in Chinchilla makalesinin önemi sadece bulgu değil. OpenAI'in 2020 Kaplan scaling laws'una karşı akademik dürüst düzeltme.

Bu nadir bir tutum: rakip şirketin temel iddiasını bilimsel olarak çürütmek. Hem bilimsel hem politik akademik dürüstlük.

Modern AI'da bu tarz dürüst karşılıklı düzeltme nadir. Çoğu şirket kendi sonuçlarını över.

"Verim odağı"

Hoffmann'in akademik tarzı: verim optimization. "Aynı bütçe ile daha iyi sonuç nasıl?" sorusu.

Bu, modern AI'da kritik soru. ChatGPT pahalı, Llama 3 ucuz — fark Hoffmann tarzı düşünce.

Sade ders

Hoffmann hikâyesinden iki şey:

Akademik dürüstlük endüstri değer yaratır. Hoffmann OpenAI'in iddiasını çürüttü; Meta bunu Llama'da uyguladı; modern AI ekonomisi farklı evrildi. Doğru bilim ekonomi yaratır.
Avrupa AI talenti çekiyor. DeepMind'den Mistral'e geçiş Avrupa AI cephesi için sembolik. Tek ABD değil, Avrupa da talent çekiyor.

Bağlam

Chinchilla için: [[chinchilla-yasalari-veri-mi-parametre-mi]]. Scaling laws için: [[scaling-laws-yapay-zekayi-buyuk-yapmak-icin-matematik-formul]]. Mistral için: [[mistral-ai-avrupa-nin-open-source-cevabı]]. DeepMind için: [[demis-hassabis-deepmind-in-vizyoner-kurucusu]]. Mensch için: [[arthur-mensch-mistral-ai-nin-fransiz-kurucusu]].

Jordan Hoffmann: Chinchilla Makalesinin Baş Yazarı

Modern LLM ekonomisinin kuralını değiştiren

Akademik kökeni

DeepMind (2019-2024)

Mistral'e geçiş (2024)

"Akademik dürüstlük"

"Verim odağı"

Sade ders

Bağlam

Kendinizi Test Edin

İlgili Yazılar

Brahmagupta: Sıfıra Kurallar Koyan ve Negatif Sayıları Borç Olarak Tanımlayan 7. Yüzyıl Hintlisi

Hypatia: İskenderiye'nin Son Büyük Kadın Matematikçisi ve Bir Çağın Sonu

Étienne Bézout: Fransız Donanmasının Matematik Hocası ve Adı Yanlış Yere Yapışmış Cebirci