Tüm yazılar
Matematik15 Mayıs 2025

GAN: İki Ağın Savaşı, Üretken Modellerin Altın Çağı

"Sahtekar ile dedektif yarıştırma" fikri 2014-2020 arasında üretken AI'nın altın çağını yarattı. Hâlâ izleri her yerde.

Matematik Karavanı 7 dk okuma 5 soru
Ayna yansıması — GAN'in iki ağın karşılıklı eğitimi

Sahtekar ile dedektif

Bir banknot sahtekarı düşün. Onun karşısında bir dedektif. Sahtekar gerçeğe yakın paralar basıyor. Dedektif sahte olanı tespit ediyor.

İkisi de gelişiyor: sahtekar daha iyi sahte yapıyor, dedektif daha iyi tespit ediyor. Sonunda sahtekar mükemmel sahte üretiyor — dedektif bile ayıramıyor.

İşte bu GAN mantığıdır.

Mimari

İki ağ:

Generator GG

Rastgele bir gürültü vektörü zz alır, sahte bir veri üretir: G(z)=x^G(z) = \hat{x}. Hedefi: gerçek veriden ayırt edilemez örnek üretmek.

Discriminator DD

Bir veri alır, gerçek mi sahte mi tahmin eder: D(x)[0,1]D(x) \in [0, 1]. Hedefi: ikisini ayırmak.

Min-max oyunu

Kayıp fonksiyonu bir iki kişilik oyun:

minGmaxDExpdata[logD(x)]+Ez[log(1D(G(z)))]\min_G \max_D \mathbb{E}_{x \sim p_{data}}[\log D(x)] + \mathbb{E}_{z}[\log(1 - D(G(z)))]

Yorum:

  • DD maksimize etmeye çalışıyor: gerçeklere 1, sahtelere 0 demeye çalışıyor.
  • GG minimize etmeye çalışıyor: DD'yi yanıltmak istiyor.

Eğitim sırasında: DD ve GG dönüşümlü güncellenir. Birinin başarısı diğerini iter.

Nash dengesi

Teorik olarak, eğitim sonunda Nash dengesi bulunur:

  • GG tam veri dağılımını öğrenir: pG=pdatap_G = p_{data}.
  • DD 0.5'te kalır — her şeye eşit olasılıkla gerçek/sahte der. Yani ayıramaz.

Pratikte bu denge nadir ulaşılır. GAN eğitimi notoryöz kararsızdır.

Eğitim sorunları

GAN'ler eğitilmesi zor olmasıyla ün yapmıştır:

  1. Mod kollapsı: GG sadece tek bir tür sahte üretmeyi öğrenebilir. Örnek: yüz veri setinde sadece bir tip yüz.
  2. Yakınsama zayıf: DD çok güçlenirse GG gradient alamaz.
  3. Hyperparametrelere hassas: Bir adım yanlış, eğitim çöker.
  4. Değerlendirme zor: Üretim kalitesini otomatik ölçmek için iyi metrik yok.

Bu sorunlar yıllarca GAN literatürünün ana teması oldu.

Çözüm girişimleri

GAN'leri stabilize etmek için yüzlerce teknik:

  • DCGAN (2015): Konvolüsyonel mimari, batch norm, leaky ReLU.
  • WGAN (2017): Wasserstein mesafesi — daha iyi gradient akışı.
  • WGAN-GP (2017): Gradient penalty — Lipschitz kısıtı.
  • Spectral Normalization (2018): Ağırlık normalizasyonu.
  • Progressive Growing (2018): Düşük çözünürlükten yüksek çözünürlüğe.
  • StyleGAN (2018): Stil ayrımı ile fotoğraf gerçekliği.

StyleGAN'in "This Person Does Not Exist" projesi 2019'da viral oldu. Web sitesi her ziyarette gerçeğinden ayırt edilemez bir yüz fotoğrafı gösterir. GAN'ların kamuya gösterimi.

Uygulamalar

GAN dünyası geniş:

  • Resim üretimi: StyleGAN, BigGAN.
  • Resim çevirisi: CycleGAN (at → zebra, gündüz → gece).
  • Görüntü onarımı: Eski fotoğraf restorasyonu.
  • Süper çözünürlük: ESRGAN — düşük çözünürlüğü yükselt.
  • Müzik üretimi: WaveGAN.
  • Veri çoğaltma: Az veriyle eğitim için sahte örnek üretimi.
  • Tıbbi: Az veriyle MRI öğrenme.

Diffusion modellerinin yükselişi

2020'den sonra diffusion modelleri (Stable Diffusion, DALL-E 2) GAN'leri büyük ölçüde geçti. Sebepler:

  1. Daha stabil eğitim: Min-max yerine MSE kayıp.
  2. Daha iyi çeşitlilik: Mod kollapsı yok.
  3. Daha kolay kontrol: Text-to-image için ideal.
  4. Ölçeklenebilir: Çok büyük modeller eğitilebilir.

Bugün üretim AI'nın standart mimarisi diffusion (ve flow matching). GAN'lar niş kaldı: hızlı çıkarım, gerçek zamanlı uygulamalar.

Ama GAN fikirleri ölmedi — adversarial eğitim, discriminator kullanımı, min-max optimizasyonu modern AI'da her yerdedir.

RLHF ile bağlantı

İlginç bir gözlem: RLHF'in PPO'su aslında bir GAN benzeridir. Politika (generator) + ödül modeli (discriminator). Hizalama eğitimi adversarial bir oyun. GAN literatürünün matematiksel araçları modern AI hizalamasında doğrudan kullanılır.

Sade ders

GAN hikâyesinden iki şey:

  1. İki taraflı dinamikler güçlüdür. Tek bir kayıp fonksiyonu yerine iki çelişkili hedef, daha güçlü temsiller üretir. Bu fikir RLHF, AlphaGo self-play, GAN'ların hepsinde merkez.
  2. Mükemmel mimari "kaybetebilir". GAN 2014-2020 hâkim oldu, sonra diffusion kazandı. AI mimari savaşları tarihsel — bir dönem standart başka bir dönem niş olabilir.

Bağlam

Goodfellow için: [[ian-goodfellow-gan-in-mucidi-ve-derin-ogrenmenin-genc-yildizi]]. Diffusion için: [[diffusion-modelleri-gurultu-ile-resim-yapmanin-sasirtici-yolu]]. Flow matching için: [[flow-matching-diffusion-un-daha-temiz-kardesi]]. RLHF için: [[dpo-direct-preference-optimization-rlhf-i-sadelestir]], [[grpo-deepseek-in-akil-yurutme-icin-rl-algoritmasi]].

Etiketler

GANüretken AIgenerative modelGoodfellowmin-max

Kendinizi Test Edin

Cevaplarınız profilinizde istatistik olarak saklanır.

1. GAN'in iki ağı nedir?

2. Mod kollapsı nedir?

3. StyleGAN ne yaptı?

4. GAN'leri diffusion modelleri neden geçti?

5. GAN fikirleri modern AI'da nerede?