VAE: Variational Autoencoder, Olasılıksal Üretici Modelin Temeli
2013'te Kingma'nın doktora tezi sırasında yazılan, üretken modellerin "neyi nasıl öğrendiğini" şekillendiren matematiksel çerçeve.

Autoencoder — sıkıştırma fikri
Klasik autoencoder: bir resmi al, sıkıştır, sonra yeniden inşa et.
"latent" (gizli) temsil. Encoder 'i 'ye sıkıştırır, decoder 'den 'i yaklaşık geri alır. Eğitim hedefi: küçük olsun.
Bu gözetimsiz: etiket gerek değil. Veri zaten kendisinin hem girdi hem hedef.
Autoencoder bilgilendirici ama bir sorunu var: latent uzayında üretim yapılamaz. Rastgele bir üret, decoder'a ver — anlamsız çıktı.
VAE — olasılık ekle
2013 Aralık. Diederik Kingma (Amsterdam Üniversitesi PhD öğrencisi) Auto-Encoding Variational Bayes makalesini yayımladı. Aynı zamanlarda Rezende ve Mohamed bağımsız benzer çalışma yaptı.
Fikir: latent temsil bir dağılım, deterministik nokta değil. Encoder 'nin dağılım parametrelerini üretir:
Latent örnek: . Sonra decoder 'den 'i üretir.
Reparameterization trick
Bir sorun: 'nin örneklemesi stokastik. Gradient akamaz. Geri yayılım kırılır.
Kingma'nın püf noktası: örneklemeyi yeniden parametreleştir:
Şimdi stokastiklik 'a kaydı, ağırlıkların gradient'i ve 'a temiz akıyor. Bu trick, VAE'yi mümkün kılan matematiksel kilit.
Kayıp — ELBO
VAE kayıp fonksiyonu Evidence Lower BOund (ELBO):
İki terim:
- Reconstruction: Decoder 'i ne kadar iyi geri üretiyor. Klasik MSE benzeri.
- KL divergence: (encoder dağılımı) ile (önsel — genelde standart normal) ne kadar uyumlu.
İkinci terim regularizer. Latent uzayın düzenli olmasını sağlar — rastgele örneklemesi anlamlı çıktı verir.
Üretim
Eğitildikten sonra üretim:
- 'den rastgele örnekle.
- Decoder ile üret.
- Yeni bir veri örneği elde et!
İlk üretken modellerden biri. GAN'lardan önce.
Sınırlar
VAE'lerin meşhur sorunları:
- Bulanık çıktı: Reconstruction kayıp Gaussian varsayar; ortalama çıktı sonucu bulanık resimler.
- Posterior collapse: Bazı durumlarda encoder 'yi göz ardı eder.
- Latent uzay ile gerçeklik arasında uyumsuzluk.
Bu sorunlar VAE'yi GAN'larla karşı karşı yarışta zayıflattı. 2015-2020 GAN'lar üretim AI'nın hâkim modeli oldu.
VAE'nin günümüze etkisi
VAE doğrudan ürün olmasa da matematiksel etkisi büyük:
- Diffusion modelleri: VAE'nin "olasılıksal latent" fikrinin uzantısı.
- Stable Diffusion: Latent uzayda diffusion yapar — VAE encoder/decoder kullanır!
- VQ-VAE: Diskret VAE; DALL-E ve müzik modellerinde.
- β-VAE: Disentanglement araştırması.
Yani Stable Diffusion altta hâlâ VAE kullanır. Modern AI'da görülmez ama bel kemiği.
Variational inference — geniş çerçeve
VAE, variational inference'in (Michael Jordan'ın 1990'larda kurduğu çerçeve) sinir ağı uyarlaması. Olasılıksal modellerde kesin posterior'u hesaplamak imkansızken, yaklaşık dağılım öğrenmek.
VAE bu yöntemi modern derin öğrenmeyle birleştirdi. Üretken AI'nın olasılıksal temellerini kurdu.
Kingma'nın sonraki çalışmaları
Kingma bu çığır açan makalenin ardından Adam optimizer (2014) makalesini de yazdı! Ba ile birlikte. Modern derin öğrenmenin standardı.
Sonra OpenAI'a katıldı (2015), Google Brain'e geçti (2018). Hâlâ Google'da. Normalizing flows ve diffusion çalışmaları.
İki büyük makale (VAE + Adam) doktora sırasında. Akademik üretkenliğin ender örneklerinden.
Sade ders
VAE hikâyesinden iki şey:
- Olasılık fikrini ekleme dönüştürür. Klasik autoencoder bir sıkıştırma aracıydı. VAE = autoencoder + olasılık. Olasılık üretim, regularizasyon, çeşitlilik getirir.
- Görünmez modeller bel kemiği olabilir. VAE doğrudan ürün değil ama Stable Diffusion ve flow matching'in altında çalışır. Akademik fikirlerin ekonomik etkisi yıllar sonra anlaşılır.
Bağlam
Diffusion modelleri için: [[diffusion-modelleri-gurultu-ile-resim-yapmanin-sasirtici-yolu]]. Flow matching için: [[flow-matching-diffusion-un-daha-temiz-kardesi]]. GAN için: [[gan-iki-aginin-savasi-uretici-modellerin-altin-cagi]]. Variational inference için: [[michael-i-jordan-makine-ogrenmesinin-istatistikci-baba-figuru]]. AdamW için: [[adamw-modern-llm-egitimlerinin-tek-optimizatoru]] (Kingma'nın Adam makalesi).
Etiketler
Kendinizi Test Edin
Cevaplarınız profilinizde istatistik olarak saklanır.
1. VAE klasik autoencoder'dan ne ile ayrılır?
2. Reparameterization trick ne işe yarar?
3. ELBO'nun iki terimi nedir?
4. VAE'nin en bilinen zayıflığı nedir?
5. VAE modern AI'da hâlâ nerede kullanılır?
İlgili Yazılar
Sekreter Problemi: Hayatın En İyi Seçimini Yapmak için "%37 Kuralı"
Bir işe alma görüşmesi, bir ev arama süreci, hatta hayat arkadaşı seçimi… Hepsinin altında aynı klasik matematik problemi yatar. Cevap şaşırtıcı biçimde tek bir sayıya bağlıdır: %37.
MatematikPisagor Teoremi ve Saklı Bir Sır: İrrasyonel Sayılar Nasıl Keşfedildi?
Dik üçgenlerle ilgili o ünlü kural, aynı zamanda matematik tarihinin en sarsıcı keşfine yol açtı: kesir olarak yazılamayan sayılar. Üstelik bu keşif, bir bilim topluluğunu temellerinden sarstı.
MatematikFibonacci Dizisi ve Altın Oran: Tavşanlardan Ayçiçeklerine Uzanan Örüntü
Bir tavşan üretme bilmecesiyle başlayan basit bir sayı dizisi, ayçiçeği tohumlarından çam kozalaklarına, deniz kabuklarından galaksilere kadar doğanın her yerinde nasıl karşımıza çıkıyor?