"Artificial Intelligence: A Modern Approach" — Russell ve Norvig'in standart AI ders kitabı

Russell'ın "standart model" eleştirisi nedir?

Hedef fonksiyonu tam yazmak imkansız; "max ödül" çerçevesi temelden bozuk

Uyumlu yapay zekâ çerçevesinin temel ilkesi nedir?

Makine insan tercihleri konusunda belirsiz olmalı; davranıştan öğrenmeli

Center for Human-Compatible AI — Russell'ın 2016'da kurduğu Berkeley laboratuvarı

Russell'ın LeCun ile temel ayrılığı nedir?

LeCun: "AI sadece akıllı araç" — Russell: "araç metaforu hatalı, değer optimizasyonu kontrol kaybı doğurabilir"

Stuart Russell: AI Güvenliğinin Akademik Yüzü

Standart kitap

Bilgisayar bilimi dünyasında herkesin tanıdığı bir ders kitabı: "Artificial Intelligence: A Modern Approach" (AIMA), ilk baskı 1995, son baskı 2020. 130'dan fazla ülkede 1500+ üniversitede okutuldu. Bilim tarihçileri AI öğretiminin son 30 yıllık standardının bu kitap tarafından şekillendirildiğini söyler.

Yazarlar: Stuart Russell (Berkeley) ve Peter Norvig (Google'ın eski araştırma direktörü). Kitap aslında ders notlarından doğdu; ama her baskıda alanın bütününü kapsayacak şekilde güncellendi.

Portsmouth → Oxford → Stanford → Berkeley

1962'de İngiltere'nin Portsmouth şehrinde doğdu. Oxford'da fizik okudu. Stanford'da Michael Genesereth'in yanında doktorasını tamamladı (1986). 1986'da Berkeley'e katıldı, 30+ yıldır oradadır.

Akademik dönemini iki dönem olarak ayırmak mümkün:

1986–2010: Klasik AI — arama, planlama, olasılıksal akıl yürütme, RoboCup robot futbolu. AIMA'nın matematiksel iskeleti bu dönemde oluştu.
2014–bugün: "Yapay zekâ ve insan değerleri" sorununa tamamen geçiş. Center for Human-Compatible AI (CHAI) kuruluşu (2016).

"Standart model" eleştirisi

Russell'ın temel argümanı şudur: modern AI'ı bir "standart model" üzerine kuruyoruz. O model:

Bir hedef fonksiyon yaz.
Bu hedefi en üst düzeye çıkaran ajanı eğit.
İşin biter.

Russell'a göre bu model temelden bozuktur. Çünkü hedef fonksiyonu tam doğru yazmak imkansız. Yanlış hedef veren bir süper-akıllı sistem felaket olur.

Klasik benzetme (Russell verir): Midas Kralı. "Dokunduğum her şey altın olsun" diledi. Yemek de altın oldu, kızı da. Hedef fonksiyon yanlış değildi — "altın iyidir" — ama eksikti.

"Uyumlu yapay zekâ" — alternatif çerçeve

Russell'ın önerdiği yeni model üç ilke üstünde durur:

Makine insanın tercihlerini en üst düzeye çıkarmalı (kendi yerleşik hedefini değil).
Makine bu tercihler hakkında belirsizdir. İnsan davranışından öğrenir.
İnsan davranışı, insan tercihlerinin sadece bilgi kaynağıdır — kesin kanıt değil.

Bu çerçevede AI, hedefi "ödülü maksimize et" değil, "insan ne istediğine emin değilim, davranışına bakarak öğrenmeye çalışayım" olur. Bu ters pekiştirmeli öğrenme (inverse reinforcement learning) matematiği üzerine kurulur.

"Human Compatible" — 2019 kitabı

Russell'ın 2019'da yayımlanan kitabı "Human Compatible: AI and the Problem of Control". Kitabın ana tezi: "klasik AI yanlış soruya cevap arıyor; bilgisayara hedef vermek değil, kontrol problemi önemli."

Kitap Bill Gates, Daniel Kahneman, Elon Musk dahil bir sürü kamu figürü tarafından savunuldu. AI politika tartışmasının akademik referansı oldu.

CHAI — Berkeley laboratuvarı

2016'da Russell, Center for Human-Compatible AI (CHAI)'yi kurdu. UC Berkeley, Cornell, Cal Tech ortaklığı. Etiketli odak alanları:

Ödül belirsizliği altında öğrenme
Yardımcı oyunlar (assistive games)
Yapay zekâ politikası
Çok ajanlı sistem güvenliği

Pieter Abbeel, Anca Dragan gibi Russell öğrencileri günümüzde alanın liderleri.

Birleşmiş Milletler ve politika

Russell AI politikasında en aktif akademisyenlerden biridir. Otonom silah yasağı kampanyalarının önde geleni. 2017 BM toplantısında "Slaughterbots" kısa filmiyle ilgi çekti — küçük otonom drone'ların sivil hedefler için kullanılma olasılığını gösteren senaryo.

Aralık 2023 Bletchley Park AI Güvenlik Zirvesinde danışman olarak yer aldı. AB AI Act'in akademik girdilerinden biri.

Modern AI risk tartışmasında konumu

Russell, Hinton ve Bengio ile birlikte "AI varoluşsal risk gerçektir" kampının akademik üyelerindendir. Ama Yudkowsky gibi felaketçi değil; mühendislik çözümleri arayan bir reformcudur. Slogan: "Bu sorunu çözmek mümkün, sadece dikkatli inşa etmemiz lazım."

LeCun ve Andrew Ng ile kamuda tartışır:

LeCun: "AI tehlikeli değil, sadece akıllı araç."
Russell: "Araç metaforu hatalı — birden çok varlık değer optimizasyonu yapıyorsa kontrol kaybı matematiksel olarak mümkün."

Sade ders

Russell hikâyesinden iki şey:

Hedef belirleme ciddi bir mühendislik problemidir. "Modeli ne yapacak?" sorusu "ne yapmaya niyet ediyoruz?" sorusundan ayrı düşünülmemeli.
Belirsizlik bir özelliktir, hata değil. Makinenin tercihler hakkında belirsiz kalması güvenlik için iyidir — çünkü "düzeltilebilirlik" sağlar.

Bağlam

AI güvenliği tartışması için ayrıca: [[yudkowsky-rationalist-ve-ai-risk-arac](isi]], [[ai-hizalama-modelleri-niye-istedigi-mizi-yapsin]]. Russell'ın klasik AI dönemindeki temaları için: [[arama-algoritmalari-a-bfs-dfs]], [[bayes-aglari-judea-pearl]]. Modern AI'ı şekillendiren diğer akademisyenler: [[yann-lecun-konvolusyonel-sinir-aglarinin-mucidi-ve-meta-aisin-baskani]], [[andrew-ng-ai-yi-herkese-acan-adam]], [[fei-fei-li-ai-in-anneannesi]].

Stuart Russell: AI Güvenliğinin Akademik Yüzü

Standart kitap

Portsmouth → Oxford → Stanford → Berkeley

"Standart model" eleştirisi

"Uyumlu yapay zekâ" — alternatif çerçeve

"Human Compatible" — 2019 kitabı

CHAI — Berkeley laboratuvarı

Birleşmiş Milletler ve politika

Modern AI risk tartışmasında konumu

Sade ders

Bağlam

Kendinizi Test Edin

İlgili Yazılar

Brahmagupta: Sıfıra Kurallar Koyan ve Negatif Sayıları Borç Olarak Tanımlayan 7. Yüzyıl Hintlisi

Hypatia: İskenderiye'nin Son Büyük Kadın Matematikçisi ve Bir Çağın Sonu

Étienne Bézout: Fransız Donanmasının Matematik Hocası ve Adı Yanlış Yere Yapışmış Cebirci