GAN: İki Ağın Savaşı, Üretken Modellerin Altın Çağı
"Sahtekar ile dedektif yarıştırma" fikri 2014-2020 arasında üretken AI'nın altın çağını yarattı. Hâlâ izleri her yerde.

Sahtekar ile dedektif
Bir banknot sahtekarı düşün. Onun karşısında bir dedektif. Sahtekar gerçeğe yakın paralar basıyor. Dedektif sahte olanı tespit ediyor.
İkisi de gelişiyor: sahtekar daha iyi sahte yapıyor, dedektif daha iyi tespit ediyor. Sonunda sahtekar mükemmel sahte üretiyor — dedektif bile ayıramıyor.
İşte bu GAN mantığıdır.
Mimari
İki ağ:
Generator
Rastgele bir gürültü vektörü alır, sahte bir veri üretir: . Hedefi: gerçek veriden ayırt edilemez örnek üretmek.
Discriminator
Bir veri alır, gerçek mi sahte mi tahmin eder: . Hedefi: ikisini ayırmak.
Min-max oyunu
Kayıp fonksiyonu bir iki kişilik oyun:
Yorum:
- maksimize etmeye çalışıyor: gerçeklere 1, sahtelere 0 demeye çalışıyor.
- minimize etmeye çalışıyor: 'yi yanıltmak istiyor.
Eğitim sırasında: ve dönüşümlü güncellenir. Birinin başarısı diğerini iter.
Nash dengesi
Teorik olarak, eğitim sonunda Nash dengesi bulunur:
- tam veri dağılımını öğrenir: .
- 0.5'te kalır — her şeye eşit olasılıkla gerçek/sahte der. Yani ayıramaz.
Pratikte bu denge nadir ulaşılır. GAN eğitimi notoryöz kararsızdır.
Eğitim sorunları
GAN'ler eğitilmesi zor olmasıyla ün yapmıştır:
- Mod kollapsı: sadece tek bir tür sahte üretmeyi öğrenebilir. Örnek: yüz veri setinde sadece bir tip yüz.
- Yakınsama zayıf: çok güçlenirse gradient alamaz.
- Hyperparametrelere hassas: Bir adım yanlış, eğitim çöker.
- Değerlendirme zor: Üretim kalitesini otomatik ölçmek için iyi metrik yok.
Bu sorunlar yıllarca GAN literatürünün ana teması oldu.
Çözüm girişimleri
GAN'leri stabilize etmek için yüzlerce teknik:
- DCGAN (2015): Konvolüsyonel mimari, batch norm, leaky ReLU.
- WGAN (2017): Wasserstein mesafesi — daha iyi gradient akışı.
- WGAN-GP (2017): Gradient penalty — Lipschitz kısıtı.
- Spectral Normalization (2018): Ağırlık normalizasyonu.
- Progressive Growing (2018): Düşük çözünürlükten yüksek çözünürlüğe.
- StyleGAN (2018): Stil ayrımı ile fotoğraf gerçekliği.
StyleGAN'in "This Person Does Not Exist" projesi 2019'da viral oldu. Web sitesi her ziyarette gerçeğinden ayırt edilemez bir yüz fotoğrafı gösterir. GAN'ların kamuya gösterimi.
Uygulamalar
GAN dünyası geniş:
- Resim üretimi: StyleGAN, BigGAN.
- Resim çevirisi: CycleGAN (at → zebra, gündüz → gece).
- Görüntü onarımı: Eski fotoğraf restorasyonu.
- Süper çözünürlük: ESRGAN — düşük çözünürlüğü yükselt.
- Müzik üretimi: WaveGAN.
- Veri çoğaltma: Az veriyle eğitim için sahte örnek üretimi.
- Tıbbi: Az veriyle MRI öğrenme.
Diffusion modellerinin yükselişi
2020'den sonra diffusion modelleri (Stable Diffusion, DALL-E 2) GAN'leri büyük ölçüde geçti. Sebepler:
- Daha stabil eğitim: Min-max yerine MSE kayıp.
- Daha iyi çeşitlilik: Mod kollapsı yok.
- Daha kolay kontrol: Text-to-image için ideal.
- Ölçeklenebilir: Çok büyük modeller eğitilebilir.
Bugün üretim AI'nın standart mimarisi diffusion (ve flow matching). GAN'lar niş kaldı: hızlı çıkarım, gerçek zamanlı uygulamalar.
Ama GAN fikirleri ölmedi — adversarial eğitim, discriminator kullanımı, min-max optimizasyonu modern AI'da her yerdedir.
RLHF ile bağlantı
İlginç bir gözlem: RLHF'in PPO'su aslında bir GAN benzeridir. Politika (generator) + ödül modeli (discriminator). Hizalama eğitimi adversarial bir oyun. GAN literatürünün matematiksel araçları modern AI hizalamasında doğrudan kullanılır.
Sade ders
GAN hikâyesinden iki şey:
- İki taraflı dinamikler güçlüdür. Tek bir kayıp fonksiyonu yerine iki çelişkili hedef, daha güçlü temsiller üretir. Bu fikir RLHF, AlphaGo self-play, GAN'ların hepsinde merkez.
- Mükemmel mimari "kaybetebilir". GAN 2014-2020 hâkim oldu, sonra diffusion kazandı. AI mimari savaşları tarihsel — bir dönem standart başka bir dönem niş olabilir.
Bağlam
Goodfellow için: [[ian-goodfellow-gan-in-mucidi-ve-derin-ogrenmenin-genc-yildizi]]. Diffusion için: [[diffusion-modelleri-gurultu-ile-resim-yapmanin-sasirtici-yolu]]. Flow matching için: [[flow-matching-diffusion-un-daha-temiz-kardesi]]. RLHF için: [[dpo-direct-preference-optimization-rlhf-i-sadelestir]], [[grpo-deepseek-in-akil-yurutme-icin-rl-algoritmasi]].
Etiketler
Kendinizi Test Edin
Cevaplarınız profilinizde istatistik olarak saklanır.
1. GAN'in iki ağı nedir?
2. Mod kollapsı nedir?
3. StyleGAN ne yaptı?
4. GAN'leri diffusion modelleri neden geçti?
5. GAN fikirleri modern AI'da nerede?
İlgili Yazılar
Sekreter Problemi: Hayatın En İyi Seçimini Yapmak için "%37 Kuralı"
Bir işe alma görüşmesi, bir ev arama süreci, hatta hayat arkadaşı seçimi… Hepsinin altında aynı klasik matematik problemi yatar. Cevap şaşırtıcı biçimde tek bir sayıya bağlıdır: %37.
MatematikPisagor Teoremi ve Saklı Bir Sır: İrrasyonel Sayılar Nasıl Keşfedildi?
Dik üçgenlerle ilgili o ünlü kural, aynı zamanda matematik tarihinin en sarsıcı keşfine yol açtı: kesir olarak yazılamayan sayılar. Üstelik bu keşif, bir bilim topluluğunu temellerinden sarstı.
MatematikFibonacci Dizisi ve Altın Oran: Tavşanlardan Ayçiçeklerine Uzanan Örüntü
Bir tavşan üretme bilmecesiyle başlayan basit bir sayı dizisi, ayçiçeği tohumlarından çam kozalaklarına, deniz kabuklarından galaksilere kadar doğanın her yerinde nasıl karşımıza çıkıyor?