GAN'in iki ağı nedir?

Generator (sahte üretir) + Discriminator (gerçek/sahte ayırır) — birbiriyle yarışır

Generator tek bir tür örnek üretir — çeşitlilik kaybı

Fotoğraf gerçekliğinde yüzler — "This Person Does Not Exist" viral oldu

GAN'leri diffusion modelleri neden geçti?

Daha stabil eğitim, daha iyi çeşitlilik, kolay metin kontrolü, ölçeklenebilirlik

GAN fikirleri modern AI'da nerede?

RLHF (politika vs ödül modeli), AlphaGo self-play, adversarial training — her yerde

GAN: İki Ağın Savaşı, Üretken Modellerin Altın Çağı

Sahtekar ile dedektif

Bir banknot sahtekarı düşün. Onun karşısında bir dedektif. Sahtekar gerçeğe yakın paralar basıyor. Dedektif sahte olanı tespit ediyor.

İkisi de gelişiyor: sahtekar daha iyi sahte yapıyor, dedektif daha iyi tespit ediyor. Sonunda sahtekar mükemmel sahte üretiyor — dedektif bile ayıramıyor.

İşte bu GAN mantığıdır.

Mimari

İki ağ:

Generator $G$

Rastgele bir gürültü vektörü $z$ alır, sahte bir veri üretir: $G(z) = \hat{x}$ . Hedefi: gerçek veriden ayırt edilemez örnek üretmek.

Discriminator $D$

Bir veri alır, gerçek mi sahte mi tahmin eder: $D(x) \in [0, 1]$ . Hedefi: ikisini ayırmak.

Min-max oyunu

Kayıp fonksiyonu bir iki kişilik oyun:

\min_G \max_D \mathbb{E}_{x \sim p_{data}}[\log D(x)] + \mathbb{E}_{z}[\log(1 - D(G(z)))]

Yorum:

$D$ maksimize etmeye çalışıyor: gerçeklere 1, sahtelere 0 demeye çalışıyor.
$G$ minimize etmeye çalışıyor: $D$ 'yi yanıltmak istiyor.

Eğitim sırasında: $D$ ve $G$ dönüşümlü güncellenir. Birinin başarısı diğerini iter.

Nash dengesi

Teorik olarak, eğitim sonunda Nash dengesi bulunur:

$G$ tam veri dağılımını öğrenir: $p_G = p_{data}$ .
$D$ 0.5'te kalır — her şeye eşit olasılıkla gerçek/sahte der. Yani ayıramaz.

Pratikte bu denge nadir ulaşılır. GAN eğitimi notoryöz kararsızdır.

Eğitim sorunları

GAN'ler eğitilmesi zor olmasıyla ün yapmıştır:

Mod kollapsı: $G$ sadece tek bir tür sahte üretmeyi öğrenebilir. Örnek: yüz veri setinde sadece bir tip yüz.
Yakınsama zayıf: $D$ çok güçlenirse $G$ gradient alamaz.
Hyperparametrelere hassas: Bir adım yanlış, eğitim çöker.
Değerlendirme zor: Üretim kalitesini otomatik ölçmek için iyi metrik yok.

Bu sorunlar yıllarca GAN literatürünün ana teması oldu.

Çözüm girişimleri

GAN'leri stabilize etmek için yüzlerce teknik:

DCGAN (2015): Konvolüsyonel mimari, batch norm, leaky ReLU.
WGAN (2017): Wasserstein mesafesi — daha iyi gradient akışı.
WGAN-GP (2017): Gradient penalty — Lipschitz kısıtı.
Spectral Normalization (2018): Ağırlık normalizasyonu.
Progressive Growing (2018): Düşük çözünürlükten yüksek çözünürlüğe.
StyleGAN (2018): Stil ayrımı ile fotoğraf gerçekliği.

StyleGAN'in "This Person Does Not Exist" projesi 2019'da viral oldu. Web sitesi her ziyarette gerçeğinden ayırt edilemez bir yüz fotoğrafı gösterir. GAN'ların kamuya gösterimi.

Uygulamalar

GAN dünyası geniş:

Resim üretimi: StyleGAN, BigGAN.
Resim çevirisi: CycleGAN (at → zebra, gündüz → gece).
Görüntü onarımı: Eski fotoğraf restorasyonu.
Süper çözünürlük: ESRGAN — düşük çözünürlüğü yükselt.
Müzik üretimi: WaveGAN.
Veri çoğaltma: Az veriyle eğitim için sahte örnek üretimi.
Tıbbi: Az veriyle MRI öğrenme.

Diffusion modellerinin yükselişi

2020'den sonra diffusion modelleri (Stable Diffusion, DALL-E 2) GAN'leri büyük ölçüde geçti. Sebepler:

Daha stabil eğitim: Min-max yerine MSE kayıp.
Daha iyi çeşitlilik: Mod kollapsı yok.
Daha kolay kontrol: Text-to-image için ideal.
Ölçeklenebilir: Çok büyük modeller eğitilebilir.

Bugün üretim AI'nın standart mimarisi diffusion (ve flow matching). GAN'lar niş kaldı: hızlı çıkarım, gerçek zamanlı uygulamalar.

Ama GAN fikirleri ölmedi — adversarial eğitim, discriminator kullanımı, min-max optimizasyonu modern AI'da her yerdedir.

RLHF ile bağlantı

İlginç bir gözlem: RLHF'in PPO'su aslında bir GAN benzeridir. Politika (generator) + ödül modeli (discriminator). Hizalama eğitimi adversarial bir oyun. GAN literatürünün matematiksel araçları modern AI hizalamasında doğrudan kullanılır.

Sade ders

GAN hikâyesinden iki şey:

İki taraflı dinamikler güçlüdür. Tek bir kayıp fonksiyonu yerine iki çelişkili hedef, daha güçlü temsiller üretir. Bu fikir RLHF, AlphaGo self-play, GAN'ların hepsinde merkez.
Mükemmel mimari "kaybetebilir". GAN 2014-2020 hâkim oldu, sonra diffusion kazandı. AI mimari savaşları tarihsel — bir dönem standart başka bir dönem niş olabilir.

Bağlam

Goodfellow için: [[ian-goodfellow-gan-in-mucidi-ve-derin-ogrenmenin-genc-yildizi]]. Diffusion için: [[diffusion-modelleri-gurultu-ile-resim-yapmanin-sasirtici-yolu]]. Flow matching için: [[flow-matching-diffusion-un-daha-temiz-kardesi]]. RLHF için: [[dpo-direct-preference-optimization-rlhf-i-sadelestir]], [[grpo-deepseek-in-akil-yurutme-icin-rl-algoritmasi]].

GAN: İki Ağın Savaşı, Üretken Modellerin Altın Çağı

Sahtekar ile dedektif

Mimari

Generator $G$

Discriminator $D$

Min-max oyunu

Nash dengesi

Eğitim sorunları

Çözüm girişimleri

Uygulamalar

Diffusion modellerinin yükselişi

RLHF ile bağlantı

Sade ders

Bağlam

Kendinizi Test Edin

İlgili Yazılar

Sekreter Problemi: Hayatın En İyi Seçimini Yapmak için "%37 Kuralı"

Pisagor Teoremi ve Saklı Bir Sır: İrrasyonel Sayılar Nasıl Keşfedildi?

Fibonacci Dizisi ve Altın Oran: Tavşanlardan Ayçiçeklerine Uzanan Örüntü

GAN: İki Ağın Savaşı, Üretken Modellerin Altın Çağı

Sahtekar ile dedektif

Mimari

Generator GGG

Discriminator DDD

Min-max oyunu

Nash dengesi

Eğitim sorunları

Çözüm girişimleri

Uygulamalar

Diffusion modellerinin yükselişi

RLHF ile bağlantı

Sade ders

Bağlam

Kendinizi Test Edin

İlgili Yazılar

Sekreter Problemi: Hayatın En İyi Seçimini Yapmak için "%37 Kuralı"

Pisagor Teoremi ve Saklı Bir Sır: İrrasyonel Sayılar Nasıl Keşfedildi?

Fibonacci Dizisi ve Altın Oran: Tavşanlardan Ayçiçeklerine Uzanan Örüntü

Generator $G$

Discriminator $D$