Tüm yazılar
Bilim Tarihi24 Nisan 2025

Aleksander Mądry: MIT'de AI Güvenliği ve Robustness Uzmanı

Polonyalı MIT profesörü, adversarial robustness alanının öncülerinden ve OpenAI Hazırlık ekibinin baş figürü.

Matematik Karavanı 6 dk okuma 5 soru
Kilit ve güvenlik — Madry'nin robustness odağı

Polonya'dan MIT'ye

Aleksander Mądry (telaffuz: "Mondri") 1986 Polonya doğumlu. Varşova Üniversitesi'nde bilgisayar bilimi (2008). EPFL'de doktora (2011, danışman Mikhail Kapralov). Konusu: rastgele algoritma teorisi.

Sonra Microsoft Research postdoc, MIT'de bilgisayar bilimi profesörü (2015). Polonya AI ekolünün lider örneği.

"Algoritma teorisinden AI güvenliğine"

Mądry'nin akademik yolculuğu klasik bilgisayar bilimi ile başlayıp modern AI güvenliği'ne uzanıyor. Bu geçiş Lukasz Kaiser'inkine benzer.

İlk yıllar: graph algorithms, optimization, randomized algorithms. Matematik ağırlıklı.

2017 sonrası: adversarial robustness, AI güvenliği, interpretability. Mühendislik problemleri.

Adversarial robustness — büyük katkı

Mądry'nin en etkili çalışması: "Towards Deep Learning Models Resistant to Adversarial Attacks" (2017). PGD (Projected Gradient Descent) adversarial training'i önerdi.

Çerçeve: eğitim sırasında en kötü adversarial örnekleri üret, modeli onlara karşı dirençli olarak eğit.

minθE(x,y)D[maxδSL(θ,x+δ,y)]\min_\theta \mathbb{E}_{(x, y) \sim D} \left[ \max_{\delta \in S} L(\theta, x + \delta, y) \right]

İçeri: kötü saldırgan en kötü bozma yapsın. Dışarı: model bunlara da doğru cevap versin.

Bu min-max formülasyonu adversarial robustness'in standart matematiksel çerçevesi oldu. 15.000+ atıf.

Robust feature'lar

2019'da bir başka temel makale: "Adversarial Examples Are Not Bugs, They Are Features".

Tez: adversarial örnekler model hatası değil. Model kötü ama gerçek istatistiksel özellikleri öğreniyor. İnsan bu özellikleri görmüyor, ama veri içeride. Bu özellikleri kullanan model adversarial saldırılara karşı zayıf.

Çözüm: modeli insan tarafından da anlamlı robust özelliklere yönlendir.

Bu makale interpretability ve safety literatüründe sık tartışılır.

MIT Center for Deployable Machine Learning

MIT'de Center for Deployable Machine Learning (CDML)'i kurdu (2021). Hedef: pratik AI sistemlerini güvenilir ve sağlam yapma. Akademi + endüstri köprüsü.

Bu merkez Stanford CRFM ve Berkeley CHAI ile birlikte modern AI güvenlik araştırmasının ana akademik laboratuvarlarından.

OpenAI Preparedness (2023–2024)

Ekim 2023'te OpenAI, Preparedness Team'i tanıttı. Görev: catastrophic AI risk değerlendirmesi.

Aleksander Mądry'i baş olarak atadı. MIT'den izin alıp tam zamanlı OpenAI'a katıldı.

Preparedness ekibi 2024'te:

  • Bio-risk, siber-risk, model çıkışı riskleri için değerlendirme çerçevesi yayımladı.
  • "Preparedness Framework" belgesini açtı.
  • GPT-4o ve sonrası modellerin risk testleri.

Mayıs 2024'te bir kısım Preparedness ekibi çatışmalardan dolayı OpenAI'dan ayrıldı (Jan Leike dahil). Mądry pozisyonunda kaldı.

MIT'ye dönüş (2024 sonu)

Kasım 2024'te OpenAI'dan ayrıldı, MIT'ye geri döndü. Açıklamada:

"AI güvenliğinin uzun vadeli ilerlemesi akademik özgürlük gerektiriyor. OpenAI'da harika işler yaptım ama akademik düşüncenin yeri farklı."

Bu transfer, modern AI güvenlik tartışmasının akademi vs endüstri gerginliğinin somut örneği.

"Pratik teorisyen"

Mądry'nin akademik tarzı: derin matematiksel temel + pratik mühendislik. Klasik akademik ya da klasik mühendis değil, ortada.

Bir 2023 konuşmasında:

"AI güvenliği matematik problemidir, ama matematik kâğıt üstünde kalmamalı. Pratik sistemlerde test edilmeli. Akademik teori + endüstri ölçeği birleşimi gerek."

Bu görüş Stuart Russell ve Chris Olah'a paralel — modern AI safety'nin teorisyen-mühendis akımının temsilcisi.

Sade ders

Mądry hikâyesinden iki şey:

  1. Akademik geçişler doğaldır. Mądry algoritma teorisinden AI güvenliğine geçti. Klasik matematiksel düşünceler modern AI problemleri için temel araçlar verir.
  2. AI güvenliğinin akademik temeli yetersiz. Endüstri laboratuvarları ürün baskısıyla çalışır; akademik düşünce uzun vadeli teori için gerekli. İkisinin köprüsü kritik.

Bağlam

Adversarial examples için: [[adversarial-examples-sinir-aglarinin-sinir-bozucu-zayifligi]]. AI güvenliği için: [[stuart-russell-ai-guvenligi-nin-akademik-yuzu]], [[chris-olah-sinir-aglarinin-mikroskopcusu]]. OpenAI için: [[mira-murati-arnavutluk-tan-openai-cto-luguna]]. Polonya AI ekolü için: [[lukasz-kaiser-tensor2tensor-dan-anthropic-e-polonyali-mimar]]. MIT için: [[daniela-rus-mit-csail-in-yumusak-robot-vizyoneri]].

Etiketler

Aleksander MadryMITAI güvenliğirobustnessOpenAI

Kendinizi Test Edin

Cevaplarınız profilinizde istatistik olarak saklanır.

1. Mądry'nin akademik kökeni nedir?

2. PGD adversarial training nedir?

3. "Bugs not features" makalesinin tezi nedir?

4. OpenAI Preparedness Team'inde rolü neydi?

5. Mądry'nin tezi nedir?