Tüm yazılar
Bilim Tarihi3 Temmuz 2025

Stuart Russell: AI Güvenliğinin Akademik Yüzü

Berkeley profesörü, en çok okunan AI ders kitabının yazarı ve "uyumlu yapay zekâ" çerçevesinin kurucusu.

Matematik Karavanı 7 dk okuma 5 soru
İnsan ve robot eli — insan-AI işbirliği

Standart kitap

Bilgisayar bilimi dünyasında herkesin tanıdığı bir ders kitabı: "Artificial Intelligence: A Modern Approach" (AIMA), ilk baskı 1995, son baskı 2020. 130'dan fazla ülkede 1500+ üniversitede okutuldu. Bilim tarihçileri AI öğretiminin son 30 yıllık standardının bu kitap tarafından şekillendirildiğini söyler.

Yazarlar: Stuart Russell (Berkeley) ve Peter Norvig (Google'ın eski araştırma direktörü). Kitap aslında ders notlarından doğdu; ama her baskıda alanın bütününü kapsayacak şekilde güncellendi.

Portsmouth → Oxford → Stanford → Berkeley

1962'de İngiltere'nin Portsmouth şehrinde doğdu. Oxford'da fizik okudu. Stanford'da Michael Genesereth'in yanında doktorasını tamamladı (1986). 1986'da Berkeley'e katıldı, 30+ yıldır oradadır.

Akademik dönemini iki dönem olarak ayırmak mümkün:

  • 1986–2010: Klasik AI — arama, planlama, olasılıksal akıl yürütme, RoboCup robot futbolu. AIMA'nın matematiksel iskeleti bu dönemde oluştu.
  • 2014–bugün: "Yapay zekâ ve insan değerleri" sorununa tamamen geçiş. Center for Human-Compatible AI (CHAI) kuruluşu (2016).

"Standart model" eleştirisi

Russell'ın temel argümanı şudur: modern AI'ı bir "standart model" üzerine kuruyoruz. O model:

  1. Bir hedef fonksiyon yaz.
  2. Bu hedefi en üst düzeye çıkaran ajanı eğit.
  3. İşin biter.

Russell'a göre bu model temelden bozuktur. Çünkü hedef fonksiyonu tam doğru yazmak imkansız. Yanlış hedef veren bir süper-akıllı sistem felaket olur.

Klasik benzetme (Russell verir): Midas Kralı. "Dokunduğum her şey altın olsun" diledi. Yemek de altın oldu, kızı da. Hedef fonksiyon yanlış değildi — "altın iyidir" — ama eksikti.

"Uyumlu yapay zekâ" — alternatif çerçeve

Russell'ın önerdiği yeni model üç ilke üstünde durur:

  1. Makine insanın tercihlerini en üst düzeye çıkarmalı (kendi yerleşik hedefini değil).
  2. Makine bu tercihler hakkında belirsizdir. İnsan davranışından öğrenir.
  3. İnsan davranışı, insan tercihlerinin sadece bilgi kaynağıdır — kesin kanıt değil.

Bu çerçevede AI, hedefi "ödülü maksimize et" değil, "insan ne istediğine emin değilim, davranışına bakarak öğrenmeye çalışayım" olur. Bu ters pekiştirmeli öğrenme (inverse reinforcement learning) matematiği üzerine kurulur.

"Human Compatible" — 2019 kitabı

Russell'ın 2019'da yayımlanan kitabı "Human Compatible: AI and the Problem of Control". Kitabın ana tezi: "klasik AI yanlış soruya cevap arıyor; bilgisayara hedef vermek değil, kontrol problemi önemli."

Kitap Bill Gates, Daniel Kahneman, Elon Musk dahil bir sürü kamu figürü tarafından savunuldu. AI politika tartışmasının akademik referansı oldu.

CHAI — Berkeley laboratuvarı

2016'da Russell, Center for Human-Compatible AI (CHAI)'yi kurdu. UC Berkeley, Cornell, Cal Tech ortaklığı. Etiketli odak alanları:

  • Ödül belirsizliği altında öğrenme
  • Yardımcı oyunlar (assistive games)
  • Yapay zekâ politikası
  • Çok ajanlı sistem güvenliği

Pieter Abbeel, Anca Dragan gibi Russell öğrencileri günümüzde alanın liderleri.

Birleşmiş Milletler ve politika

Russell AI politikasında en aktif akademisyenlerden biridir. Otonom silah yasağı kampanyalarının önde geleni. 2017 BM toplantısında "Slaughterbots" kısa filmiyle ilgi çekti — küçük otonom drone'ların sivil hedefler için kullanılma olasılığını gösteren senaryo.

Aralık 2023 Bletchley Park AI Güvenlik Zirvesinde danışman olarak yer aldı. AB AI Act'in akademik girdilerinden biri.

Modern AI risk tartışmasında konumu

Russell, Hinton ve Bengio ile birlikte "AI varoluşsal risk gerçektir" kampının akademik üyelerindendir. Ama Yudkowsky gibi felaketçi değil; mühendislik çözümleri arayan bir reformcudur. Slogan: "Bu sorunu çözmek mümkün, sadece dikkatli inşa etmemiz lazım."

LeCun ve Andrew Ng ile kamuda tartışır:

  • LeCun: "AI tehlikeli değil, sadece akıllı araç."
  • Russell: "Araç metaforu hatalı — birden çok varlık değer optimizasyonu yapıyorsa kontrol kaybı matematiksel olarak mümkün."

Sade ders

Russell hikâyesinden iki şey:

  1. Hedef belirleme ciddi bir mühendislik problemidir. "Modeli ne yapacak?" sorusu "ne yapmaya niyet ediyoruz?" sorusundan ayrı düşünülmemeli.
  2. Belirsizlik bir özelliktir, hata değil. Makinenin tercihler hakkında belirsiz kalması güvenlik için iyidir — çünkü "düzeltilebilirlik" sağlar.

Bağlam

AI güvenliği tartışması için ayrıca: [[yudkowsky-rationalist-ve-ai-risk-arac](isi]], [[ai-hizalama-modelleri-niye-istedigi-mizi-yapsin]]. Russell'ın klasik AI dönemindeki temaları için: [[arama-algoritmalari-a-bfs-dfs]], [[bayes-aglari-judea-pearl]]. Modern AI'ı şekillendiren diğer akademisyenler: [[yann-lecun-konvolusyonel-sinir-aglarinin-mucidi-ve-meta-aisin-baskani]], [[andrew-ng-ai-yi-herkese-acan-adam]], [[fei-fei-li-ai-in-anneannesi]].

Etiketler

Stuart RussellAI güvenliğiAIMACHAIalignment

Kendinizi Test Edin

Cevaplarınız profilinizde istatistik olarak saklanır.

1. AIMA nedir?

2. Russell'ın "standart model" eleştirisi nedir?

3. Uyumlu yapay zekâ çerçevesinin temel ilkesi nedir?

4. CHAI nedir?

5. Russell'ın LeCun ile temel ayrılığı nedir?