Mądry'nin akademik kökeni nedir?

Algoritma teorisi (Polonya + EPFL PhD) — sonra AI güvenliğine geçti

PGD adversarial training nedir?

En kötü adversarial örneği üret + modeli ona dirençli eğit (min-max formülasyon)

"Bugs not features" makalesinin tezi nedir?

Adversarial örnekler model hatası değil — model kötü ama gerçek özellikleri öğreniyor

OpenAI Preparedness Team'inde rolü neydi?

Baş — catastrophic AI risk değerlendirmesi (2023-2024)

Mądry'nin tezi nedir?

Akademik teori + endüstri ölçeği birleşimi — pratik teorisyen

Aleksander Mądry: MIT'de AI Güvenliği ve Robustness Uzmanı

Polonya'dan MIT'ye

Aleksander Mądry (telaffuz: "Mondri") 1986 Polonya doğumlu. Varşova Üniversitesi'nde bilgisayar bilimi (2008). EPFL'de doktora (2011, danışman Mikhail Kapralov). Konusu: rastgele algoritma teorisi.

Sonra Microsoft Research postdoc, MIT'de bilgisayar bilimi profesörü (2015). Polonya AI ekolünün lider örneği.

"Algoritma teorisinden AI güvenliğine"

Mądry'nin akademik yolculuğu klasik bilgisayar bilimi ile başlayıp modern AI güvenliği'ne uzanıyor. Bu geçiş Lukasz Kaiser'inkine benzer.

İlk yıllar: graph algorithms, optimization, randomized algorithms. Matematik ağırlıklı.

2017 sonrası: adversarial robustness, AI güvenliği, interpretability. Mühendislik problemleri.

Adversarial robustness — büyük katkı

Mądry'nin en etkili çalışması: "Towards Deep Learning Models Resistant to Adversarial Attacks" (2017). PGD (Projected Gradient Descent) adversarial training'i önerdi.

Çerçeve: eğitim sırasında en kötü adversarial örnekleri üret, modeli onlara karşı dirençli olarak eğit.

\min_\theta \mathbb{E}_{(x, y) \sim D} \left[ \max_{\delta \in S} L(\theta, x + \delta, y) \right]

İçeri: kötü saldırgan en kötü bozma yapsın. Dışarı: model bunlara da doğru cevap versin.

Bu min-max formülasyonu adversarial robustness'in standart matematiksel çerçevesi oldu. 15.000+ atıf.

Robust feature'lar

2019'da bir başka temel makale: "Adversarial Examples Are Not Bugs, They Are Features".

Tez: adversarial örnekler model hatası değil. Model kötü ama gerçek istatistiksel özellikleri öğreniyor. İnsan bu özellikleri görmüyor, ama veri içeride. Bu özellikleri kullanan model adversarial saldırılara karşı zayıf.

Çözüm: modeli insan tarafından da anlamlı robust özelliklere yönlendir.

Bu makale interpretability ve safety literatüründe sık tartışılır.

MIT Center for Deployable Machine Learning

MIT'de Center for Deployable Machine Learning (CDML)'i kurdu (2021). Hedef: pratik AI sistemlerini güvenilir ve sağlam yapma. Akademi + endüstri köprüsü.

Bu merkez Stanford CRFM ve Berkeley CHAI ile birlikte modern AI güvenlik araştırmasının ana akademik laboratuvarlarından.

OpenAI Preparedness (2023–2024)

Ekim 2023'te OpenAI, Preparedness Team'i tanıttı. Görev: catastrophic AI risk değerlendirmesi.

Aleksander Mądry'i baş olarak atadı. MIT'den izin alıp tam zamanlı OpenAI'a katıldı.

Preparedness ekibi 2024'te:

Bio-risk, siber-risk, model çıkışı riskleri için değerlendirme çerçevesi yayımladı.
"Preparedness Framework" belgesini açtı.
GPT-4o ve sonrası modellerin risk testleri.

Mayıs 2024'te bir kısım Preparedness ekibi çatışmalardan dolayı OpenAI'dan ayrıldı (Jan Leike dahil). Mądry pozisyonunda kaldı.

MIT'ye dönüş (2024 sonu)

Kasım 2024'te OpenAI'dan ayrıldı, MIT'ye geri döndü. Açıklamada:

"AI güvenliğinin uzun vadeli ilerlemesi akademik özgürlük gerektiriyor. OpenAI'da harika işler yaptım ama akademik düşüncenin yeri farklı."

Bu transfer, modern AI güvenlik tartışmasının akademi vs endüstri gerginliğinin somut örneği.

"Pratik teorisyen"

Mądry'nin akademik tarzı: derin matematiksel temel + pratik mühendislik. Klasik akademik ya da klasik mühendis değil, ortada.

Bir 2023 konuşmasında:

"AI güvenliği matematik problemidir, ama matematik kâğıt üstünde kalmamalı. Pratik sistemlerde test edilmeli. Akademik teori + endüstri ölçeği birleşimi gerek."

Bu görüş Stuart Russell ve Chris Olah'a paralel — modern AI safety'nin teorisyen-mühendis akımının temsilcisi.

Sade ders

Mądry hikâyesinden iki şey:

Akademik geçişler doğaldır. Mądry algoritma teorisinden AI güvenliğine geçti. Klasik matematiksel düşünceler modern AI problemleri için temel araçlar verir.
AI güvenliğinin akademik temeli yetersiz. Endüstri laboratuvarları ürün baskısıyla çalışır; akademik düşünce uzun vadeli teori için gerekli. İkisinin köprüsü kritik.

Bağlam

Adversarial examples için: [[adversarial-examples-sinir-aglarinin-sinir-bozucu-zayifligi]]. AI güvenliği için: [[stuart-russell-ai-guvenligi-nin-akademik-yuzu]], [[chris-olah-sinir-aglarinin-mikroskopcusu]]. OpenAI için: [[mira-murati-arnavutluk-tan-openai-cto-luguna]]. Polonya AI ekolü için: [[lukasz-kaiser-tensor2tensor-dan-anthropic-e-polonyali-mimar]]. MIT için: [[daniela-rus-mit-csail-in-yumusak-robot-vizyoneri]].

Aleksander Mądry: MIT'de AI Güvenliği ve Robustness Uzmanı

Polonya'dan MIT'ye

"Algoritma teorisinden AI güvenliğine"

Adversarial robustness — büyük katkı

Robust feature'lar

MIT Center for Deployable Machine Learning

OpenAI Preparedness (2023–2024)

MIT'ye dönüş (2024 sonu)

"Pratik teorisyen"

Sade ders

Bağlam

Kendinizi Test Edin

İlgili Yazılar

Brahmagupta: Sıfıra Kurallar Koyan ve Negatif Sayıları Borç Olarak Tanımlayan 7. Yüzyıl Hintlisi

Hypatia: İskenderiye'nin Son Büyük Kadın Matematikçisi ve Bir Çağın Sonu

Étienne Bézout: Fransız Donanmasının Matematik Hocası ve Adı Yanlış Yere Yapışmış Cebirci