Stuart Russell: AI Güvenliğinin Akademik Yüzü
Berkeley profesörü, en çok okunan AI ders kitabının yazarı ve "uyumlu yapay zekâ" çerçevesinin kurucusu.

Standart kitap
Bilgisayar bilimi dünyasında herkesin tanıdığı bir ders kitabı: "Artificial Intelligence: A Modern Approach" (AIMA), ilk baskı 1995, son baskı 2020. 130'dan fazla ülkede 1500+ üniversitede okutuldu. Bilim tarihçileri AI öğretiminin son 30 yıllık standardının bu kitap tarafından şekillendirildiğini söyler.
Yazarlar: Stuart Russell (Berkeley) ve Peter Norvig (Google'ın eski araştırma direktörü). Kitap aslında ders notlarından doğdu; ama her baskıda alanın bütününü kapsayacak şekilde güncellendi.
Portsmouth → Oxford → Stanford → Berkeley
1962'de İngiltere'nin Portsmouth şehrinde doğdu. Oxford'da fizik okudu. Stanford'da Michael Genesereth'in yanında doktorasını tamamladı (1986). 1986'da Berkeley'e katıldı, 30+ yıldır oradadır.
Akademik dönemini iki dönem olarak ayırmak mümkün:
- 1986–2010: Klasik AI — arama, planlama, olasılıksal akıl yürütme, RoboCup robot futbolu. AIMA'nın matematiksel iskeleti bu dönemde oluştu.
- 2014–bugün: "Yapay zekâ ve insan değerleri" sorununa tamamen geçiş. Center for Human-Compatible AI (CHAI) kuruluşu (2016).
"Standart model" eleştirisi
Russell'ın temel argümanı şudur: modern AI'ı bir "standart model" üzerine kuruyoruz. O model:
- Bir hedef fonksiyon yaz.
- Bu hedefi en üst düzeye çıkaran ajanı eğit.
- İşin biter.
Russell'a göre bu model temelden bozuktur. Çünkü hedef fonksiyonu tam doğru yazmak imkansız. Yanlış hedef veren bir süper-akıllı sistem felaket olur.
Klasik benzetme (Russell verir): Midas Kralı. "Dokunduğum her şey altın olsun" diledi. Yemek de altın oldu, kızı da. Hedef fonksiyon yanlış değildi — "altın iyidir" — ama eksikti.
"Uyumlu yapay zekâ" — alternatif çerçeve
Russell'ın önerdiği yeni model üç ilke üstünde durur:
- Makine insanın tercihlerini en üst düzeye çıkarmalı (kendi yerleşik hedefini değil).
- Makine bu tercihler hakkında belirsizdir. İnsan davranışından öğrenir.
- İnsan davranışı, insan tercihlerinin sadece bilgi kaynağıdır — kesin kanıt değil.
Bu çerçevede AI, hedefi "ödülü maksimize et" değil, "insan ne istediğine emin değilim, davranışına bakarak öğrenmeye çalışayım" olur. Bu ters pekiştirmeli öğrenme (inverse reinforcement learning) matematiği üzerine kurulur.
"Human Compatible" — 2019 kitabı
Russell'ın 2019'da yayımlanan kitabı "Human Compatible: AI and the Problem of Control". Kitabın ana tezi: "klasik AI yanlış soruya cevap arıyor; bilgisayara hedef vermek değil, kontrol problemi önemli."
Kitap Bill Gates, Daniel Kahneman, Elon Musk dahil bir sürü kamu figürü tarafından savunuldu. AI politika tartışmasının akademik referansı oldu.
CHAI — Berkeley laboratuvarı
2016'da Russell, Center for Human-Compatible AI (CHAI)'yi kurdu. UC Berkeley, Cornell, Cal Tech ortaklığı. Etiketli odak alanları:
- Ödül belirsizliği altında öğrenme
- Yardımcı oyunlar (assistive games)
- Yapay zekâ politikası
- Çok ajanlı sistem güvenliği
Pieter Abbeel, Anca Dragan gibi Russell öğrencileri günümüzde alanın liderleri.
Birleşmiş Milletler ve politika
Russell AI politikasında en aktif akademisyenlerden biridir. Otonom silah yasağı kampanyalarının önde geleni. 2017 BM toplantısında "Slaughterbots" kısa filmiyle ilgi çekti — küçük otonom drone'ların sivil hedefler için kullanılma olasılığını gösteren senaryo.
Aralık 2023 Bletchley Park AI Güvenlik Zirvesinde danışman olarak yer aldı. AB AI Act'in akademik girdilerinden biri.
Modern AI risk tartışmasında konumu
Russell, Hinton ve Bengio ile birlikte "AI varoluşsal risk gerçektir" kampının akademik üyelerindendir. Ama Yudkowsky gibi felaketçi değil; mühendislik çözümleri arayan bir reformcudur. Slogan: "Bu sorunu çözmek mümkün, sadece dikkatli inşa etmemiz lazım."
LeCun ve Andrew Ng ile kamuda tartışır:
- LeCun: "AI tehlikeli değil, sadece akıllı araç."
- Russell: "Araç metaforu hatalı — birden çok varlık değer optimizasyonu yapıyorsa kontrol kaybı matematiksel olarak mümkün."
Sade ders
Russell hikâyesinden iki şey:
- Hedef belirleme ciddi bir mühendislik problemidir. "Modeli ne yapacak?" sorusu "ne yapmaya niyet ediyoruz?" sorusundan ayrı düşünülmemeli.
- Belirsizlik bir özelliktir, hata değil. Makinenin tercihler hakkında belirsiz kalması güvenlik için iyidir — çünkü "düzeltilebilirlik" sağlar.
Bağlam
AI güvenliği tartışması için ayrıca: [[yudkowsky-rationalist-ve-ai-risk-arac](isi]], [[ai-hizalama-modelleri-niye-istedigi-mizi-yapsin]]. Russell'ın klasik AI dönemindeki temaları için: [[arama-algoritmalari-a-bfs-dfs]], [[bayes-aglari-judea-pearl]]. Modern AI'ı şekillendiren diğer akademisyenler: [[yann-lecun-konvolusyonel-sinir-aglarinin-mucidi-ve-meta-aisin-baskani]], [[andrew-ng-ai-yi-herkese-acan-adam]], [[fei-fei-li-ai-in-anneannesi]].
Etiketler
Kendinizi Test Edin
Cevaplarınız profilinizde istatistik olarak saklanır.
1. AIMA nedir?
2. Russell'ın "standart model" eleştirisi nedir?
3. Uyumlu yapay zekâ çerçevesinin temel ilkesi nedir?
4. CHAI nedir?
5. Russell'ın LeCun ile temel ayrılığı nedir?
İlgili Yazılar
Brahmagupta: Sıfıra Kurallar Koyan ve Negatif Sayıları Borç Olarak Tanımlayan 7. Yüzyıl Hintlisi
628 yılında Brahmagupta, sıfırın aritmetiğini ve negatif sayıların kurallarını ilk kez sistematik biçimde yazdı. Borç-mülk metaforuyla negatif sayıları meşrulaştırdı, ikinci dereceden denklem formülünü genelleştirdi.
Bilim TarihiHypatia: İskenderiye'nin Son Büyük Kadın Matematikçisi ve Bir Çağın Sonu
M.S. 4. yüzyıl İskenderiye'sinde, dünyanın en büyük kütüphanesinin gölgesinde bir kadın geometri ve astronomi dersleri veriyordu. Hikâyesi, bir bilim insanının ötesinde, bir çağın bittiğini anlatır.
Bilim TarihiÉtienne Bézout: Fransız Donanmasının Matematik Hocası ve Adı Yanlış Yere Yapışmış Cebirci
Adı bugün her kriptografi dersinde geçen Bézout, hayatta sınava hazırlanan denizci adaylarına ders kitabı yazdı. Ünü, kendi bulmadığı bir teoremden geldi; kendi büyük teoremi ise nesiller boyunca anlaşılamadı.