Tüm yazılar
Matematik9 Mayıs 2025

VAE: Variational Autoencoder, Olasılıksal Üretici Modelin Temeli

2013'te Kingma'nın doktora tezi sırasında yazılan, üretken modellerin "neyi nasıl öğrendiğini" şekillendiren matematiksel çerçeve.

Matematik Karavanı 7 dk okuma 5 soru
Ayna yansıması — autoencoder'in sıkıştırma + yeniden üretim metaforu

Autoencoder — sıkıştırma fikri

Klasik autoencoder: bir resmi al, sıkıştır, sonra yeniden inşa et.

xencoderzdecoderx^x \xrightarrow{\text{encoder}} z \xrightarrow{\text{decoder}} \hat{x}

zz "latent" (gizli) temsil. Encoder xx'i zz'ye sıkıştırır, decoder zz'den xx'i yaklaşık geri alır. Eğitim hedefi: xx^2|x - \hat{x}|^2 küçük olsun.

Bu gözetimsiz: etiket gerek değil. Veri zaten kendisinin hem girdi hem hedef.

Autoencoder bilgilendirici ama bir sorunu var: latent uzayında üretim yapılamaz. Rastgele bir zz üret, decoder'a ver — anlamsız çıktı.

VAE — olasılık ekle

2013 Aralık. Diederik Kingma (Amsterdam Üniversitesi PhD öğrencisi) Auto-Encoding Variational Bayes makalesini yayımladı. Aynı zamanlarda Rezende ve Mohamed bağımsız benzer çalışma yaptı.

Fikir: latent temsil bir dağılım, deterministik nokta değil. Encoder zz'nin dağılım parametrelerini üretir:

encoder:x(μ,σ)\text{encoder}: x \to (\mu, \sigma)

Latent örnek: zN(μ,σ2)z \sim \mathcal{N}(\mu, \sigma^2). Sonra decoder zz'den xx'i üretir.

Reparameterization trick

Bir sorun: zz'nin örneklemesi stokastik. Gradient akamaz. Geri yayılım kırılır.

Kingma'nın püf noktası: örneklemeyi yeniden parametreleştir:

z=μ+σϵ,ϵN(0,1)z = \mu + \sigma \cdot \epsilon, \quad \epsilon \sim \mathcal{N}(0, 1)

Şimdi stokastiklik ϵ\epsilon'a kaydı, ağırlıkların gradient'i μ\mu ve σ\sigma'a temiz akıyor. Bu trick, VAE'yi mümkün kılan matematiksel kilit.

Kayıp — ELBO

VAE kayıp fonksiyonu Evidence Lower BOund (ELBO):

L=Eq[logp(xz)]KL(q(zx)p(z))L = \mathbb{E}_q[\log p(x|z)] - \text{KL}(q(z|x) \| p(z))

İki terim:

  1. Reconstruction: Decoder xx'i ne kadar iyi geri üretiyor. Klasik MSE benzeri.
  2. KL divergence: q(zx)q(z|x) (encoder dağılımı) ile p(z)p(z) (önsel — genelde standart normal) ne kadar uyumlu.

İkinci terim regularizer. Latent uzayın düzenli olmasını sağlar — rastgele zz örneklemesi anlamlı çıktı verir.

Üretim

Eğitildikten sonra üretim:

  1. p(z)=N(0,I)p(z) = \mathcal{N}(0, I)'den rastgele zz örnekle.
  2. Decoder ile x^\hat{x} üret.
  3. Yeni bir veri örneği elde et!

İlk üretken modellerden biri. GAN'lardan önce.

Sınırlar

VAE'lerin meşhur sorunları:

  1. Bulanık çıktı: Reconstruction kayıp Gaussian varsayar; ortalama çıktı sonucu bulanık resimler.
  2. Posterior collapse: Bazı durumlarda encoder zz'yi göz ardı eder.
  3. Latent uzay ile gerçeklik arasında uyumsuzluk.

Bu sorunlar VAE'yi GAN'larla karşı karşı yarışta zayıflattı. 2015-2020 GAN'lar üretim AI'nın hâkim modeli oldu.

VAE'nin günümüze etkisi

VAE doğrudan ürün olmasa da matematiksel etkisi büyük:

  • Diffusion modelleri: VAE'nin "olasılıksal latent" fikrinin uzantısı.
  • Stable Diffusion: Latent uzayda diffusion yapar — VAE encoder/decoder kullanır!
  • VQ-VAE: Diskret VAE; DALL-E ve müzik modellerinde.
  • β-VAE: Disentanglement araştırması.

Yani Stable Diffusion altta hâlâ VAE kullanır. Modern AI'da görülmez ama bel kemiği.

Variational inference — geniş çerçeve

VAE, variational inference'in (Michael Jordan'ın 1990'larda kurduğu çerçeve) sinir ağı uyarlaması. Olasılıksal modellerde kesin posterior'u hesaplamak imkansızken, yaklaşık dağılım öğrenmek.

VAE bu yöntemi modern derin öğrenmeyle birleştirdi. Üretken AI'nın olasılıksal temellerini kurdu.

Kingma'nın sonraki çalışmaları

Kingma bu çığır açan makalenin ardından Adam optimizer (2014) makalesini de yazdı! Ba ile birlikte. Modern derin öğrenmenin standardı.

Sonra OpenAI'a katıldı (2015), Google Brain'e geçti (2018). Hâlâ Google'da. Normalizing flows ve diffusion çalışmaları.

İki büyük makale (VAE + Adam) doktora sırasında. Akademik üretkenliğin ender örneklerinden.

Sade ders

VAE hikâyesinden iki şey:

  1. Olasılık fikrini ekleme dönüştürür. Klasik autoencoder bir sıkıştırma aracıydı. VAE = autoencoder + olasılık. Olasılık üretim, regularizasyon, çeşitlilik getirir.
  2. Görünmez modeller bel kemiği olabilir. VAE doğrudan ürün değil ama Stable Diffusion ve flow matching'in altında çalışır. Akademik fikirlerin ekonomik etkisi yıllar sonra anlaşılır.

Bağlam

Diffusion modelleri için: [[diffusion-modelleri-gurultu-ile-resim-yapmanin-sasirtici-yolu]]. Flow matching için: [[flow-matching-diffusion-un-daha-temiz-kardesi]]. GAN için: [[gan-iki-aginin-savasi-uretici-modellerin-altin-cagi]]. Variational inference için: [[michael-i-jordan-makine-ogrenmesinin-istatistikci-baba-figuru]]. AdamW için: [[adamw-modern-llm-egitimlerinin-tek-optimizatoru]] (Kingma'nın Adam makalesi).

Etiketler

VAEautoencodervariational inferenceüretken AIKingma

Kendinizi Test Edin

Cevaplarınız profilinizde istatistik olarak saklanır.

1. VAE klasik autoencoder'dan ne ile ayrılır?

2. Reparameterization trick ne işe yarar?

3. ELBO'nun iki terimi nedir?

4. VAE'nin en bilinen zayıflığı nedir?

5. VAE modern AI'da hâlâ nerede kullanılır?