Flow Matching: Diffusion'un Daha Temiz Kardeşi
2022'de tanıtılan, Stable Diffusion 3 ve Sora'nın altında yatan üretken modelleme tekniği. Diffusion'dan basit, hızlı ve esnek.

Bir düşünce deneyi
Beyaz bir tuvaliniz var. Onu bir Picasso tablosuna dönüştürmek istiyorsunuz. Hangi yoldan?
- Diffusion (2020): Tuvali rastgele gürültüden başlatın, adım adım gürültüyü temizleyin. 1000 adım sonra tablo çıkar. Her adım: "şu anki gürültülü görüntü → biraz daha az gürültülü görüntü."
- Flow Matching (2022): Gürültüden tabloya düz bir çizgi çizin. Her noktada "şu anda hangi yöne git?" diye sorun. 4–50 adımda iş biter.
İki yöntem de çalışır. İkincisi daha basit ve hızlıdır. Bu yüzden 2024 sonrasında Stable Diffusion 3, Sora, Flux hep flow matching kullanır.
Matematiksel iskelet
İki dağılımınız var: (basit, mesela standart normal gürültü) ve (karmaşık, mesela kedilerin resimleri). Soru: 'dan 'e nasıl gideriz?
Flow matching cevabı: bir vektör alanı öğren — her zaman noktası ve her uzay noktası için "hangi yöne git" der. Bir veri noktası bu alanı izleyerek hareket eder:
Eğer doğruysa, 'da gürültü olan parçacık 'de bir kedi resmine ulaşır.
Püf nokta: doğrudan eğit
Diffusion'da hedef "gürültüyü tahmin et" — dolaylı. Flow matching'te hedef daha düz:
- Bir veri örneği al (gerçek kedi).
- Bir gürültü örneği al.
- Aralarına düz çizgi çek: .
- Bu çizginin doğru yönü: (sabit hız).
- Sinir ağına ve ver, tahmin etmesini iste. Kayıp: .
Bu kadar. Diffusion'daki karmaşık gürültü çizelgeleri, score fonksiyonu hesapları yok.
Neden hızlı
Diffusion eğitildiği "rota" karmakarışıktır — gürültüden veriye giden yol kıvrımlıdır. Örnekleme sırasında bu rotayı 50–1000 küçük adımda izlemek gerek.
Flow matching düz çizgi rotaları öğrenir. Düz bir çizgide ilerlemek için 4–10 adım yeter. Test zamanı 10–100 kat hızlı.
"Conditional" püf noktası
Yukarıdaki şema iki nokta arasında düz çizgi çiziyor. Ama gerçekte "ortalama yön" olmalı — aynı 'ye birçok farklı çiftinden gelinebilir.
Lipman ve ark. (2022) gösterdi: koşullu kayıp (her örnek için kendi düz çizgisi) marjinal kayıp ile aynı gradyanı verir. Yani sinir ağı, bir sürü düz çizgiyi tek tek eğitse de doğru "ortalama akışı" öğrenir. Bu eşitlik tüm yöntemi geçerli kılar.
Optimal taşıma bağlantısı
Flow matching aslında optimal transport (OT) probleminin sürekli versiyonudur. Monge–Kantorovich problemi sorar: 'dan 'e malları taşımanın en ucuz yolu nedir? Cevap: ve 'in birleşik dağılımında "kestirme" çizgiler.
Eğer çiftlerini OT'ye göre eşleştirirseniz, çizgileriniz birbirini kesmez, akış çok temiz olur. Bu OT-CFM (Optimal Transport Conditional Flow Matching) — 2023'ün popüler varyantı.
Endüstri kullanımı
- Stable Diffusion 3 (2024): Rectified Flow Matching, 1024×1024 görüntü, daha az adım.
- Sora (2024, OpenAI): Video için flow matching; 60 saniyelik tutarlı klipler.
- Flux (2024, Black Forest Labs): State-of-the-art açık kaynak; Stable Diffusion'ın yeni rakibi.
- AlphaFold 3 (2024): Protein katlanması için flow matching modülü; AlphaFold 2'nin difüzyon benzeri yerine.
Diffusion vs. Flow Matching — özet karşılaştırma
| Kriter | Diffusion | Flow Matching |
|---|---|---|
| Eğitim hedefi | Gürültü tahmini | Vektör alanı (yön) |
| Rota şekli | Kıvrımlı | (Yaklaşık) düz |
| Örnekleme adımı | 50–1000 | 4–50 |
| Matematik | Stokastik SDE | Deterministik ODE |
| Uygulama | DALL-E 2, SD 1/2 | SD 3, Sora, Flux |
İkisi de aynı problemin (gürültüden veriye dönüştürme) iki dili. Flow matching daha temiz, daha hızlı; bu yüzden 2024'ten itibaren yeni modeller hep flow matching tabanlı.
Sade benzetme
Diffusion: "Bir labirentin içinden çıkmak için 1000 küçük dönüş yap."
Flow matching: "Hedefe düz çizgi çek, 10 adımda var ol."
Bağlam
Bu tema [[diffusion-modelleri-gurultu-ile-resim-yapmanin-sasirtici-yolu]] üzerine kurulmuştur. Üretken AI'ın bütün manzarası için [[generative-ai-modern-uretici-modellerin-haritasi]] ve modern transformer mimarileri için [[transformer-attention-is-all-you-need]].
Etiketler
Kendinizi Test Edin
Cevaplarınız profilinizde istatistik olarak saklanır.
1. Flow Matching ne yapar?
2. Diffusion ile farkı nedir?
3. Conditional Flow Matching neden çalışır?
4. Optimal Transport (OT) bağlantısı nedir?
5. Hangi modern modeller flow matching kullanır?
İlgili Yazılar
Sekreter Problemi: Hayatın En İyi Seçimini Yapmak için "%37 Kuralı"
Bir işe alma görüşmesi, bir ev arama süreci, hatta hayat arkadaşı seçimi… Hepsinin altında aynı klasik matematik problemi yatar. Cevap şaşırtıcı biçimde tek bir sayıya bağlıdır: %37.
MatematikPisagor Teoremi ve Saklı Bir Sır: İrrasyonel Sayılar Nasıl Keşfedildi?
Dik üçgenlerle ilgili o ünlü kural, aynı zamanda matematik tarihinin en sarsıcı keşfine yol açtı: kesir olarak yazılamayan sayılar. Üstelik bu keşif, bir bilim topluluğunu temellerinden sarstı.
MatematikFibonacci Dizisi ve Altın Oran: Tavşanlardan Ayçiçeklerine Uzanan Örüntü
Bir tavşan üretme bilmecesiyle başlayan basit bir sayı dizisi, ayçiçeği tohumlarından çam kozalaklarına, deniz kabuklarından galaksilere kadar doğanın her yerinde nasıl karşımıza çıkıyor?