Tüm yazılar
Matematik25 Ağustos 2025

Wasserstein Mesafesi: Bir Kum Tepesini Diğerine Taşımanın En Az Maliyeti

İki olasılık dağılımı arasındaki "mesafe" nedir? Klasik yöntemler eksik. Wasserstein mesafesi (Earth Mover's Distance) **kum tepeleri** metaforuyla doğal cevabı verir. Modern AI, GAN'lar, optimal transport için kritik.

Matematik Karavanı Editörü 5 dk okuma 5 soru
Sahilde kum tepesi — Wasserstein'in metaforu

"Bu iki kum tepesi ne kadar farklı?"

İki kum tepesi var: AA ve BB. Aynı miktarda kum.

Soru: AA'yı BB'ye dönüştürmek için en az iş ne?

Cevap: her birim kumu AA'daki yerinden BB'deki yerine taşımak. Her birim için mesafe × ağırlık. Toplam = .

Bu, Wasserstein mesafesi (Earth Mover's Distance, EMD).

Olasılık dağılımları için

Aynı fikir olasılık dağılımları için: PP ve QQ iki dağılım. PP'yi QQ'ya dönüştürmek için optimum transport planı:

W1(P,Q)=infπΠ(P,Q)xydπ(x,y)W_1(P, Q) = \inf_{\pi \in \Pi(P, Q)} \int |x - y| \, d\pi(x, y)

π\pi = transport planı, Π(P,Q)\Pi(P, Q) = P,QP, Q marjinalli birleşik dağılımlar.

Niçin önemli?

KL divergence yetersiz

Klasik Kullback-Leibler divergence: DKL(PQ)=plog(p/q)D_{KL}(P || Q) = \int p \log(p/q).

Sorun: PP ve QQ aynı destek kümesinde değilse sonsuz olur.

Örnek: PP tek bir nokta 0'da, QQ tek bir nokta 1'de. DKL=D_{KL} = \infty. Ama mesafe 1 olmalı.

Wasserstein'in zarafeti

Wasserstein PP ve QQ farklı destekte olsa bile anlamlı: tam olarak noktalar arası geometrik mesafe.

Tarihsel köken

  • Gaspard Monge (1781): "Mémoire sur la théorie des déblais et des remblais" — toprak hareketinde optimum. Optimal transport problemi'nin ilk versiyonu.
  • Leonid Kantorovich (1942): modern formülasyon, dualite. 1975 Nobel Ekonomi.
  • Cédric Villani (2000'ler): modern matematik teori. 2010 Fields.
  • Wasserstein (Vasershtein, 1969): Sovyet matematikçi, adı yanlış yere yapışmış (yine!).

Modern uygulamalar

1. WGAN (Wasserstein GAN)

Arjovsky, Chintala, Bottou (2017): GAN'ları Wasserstein mesafesi ile eğitme. Klasik GAN'ın mode collapse sorununu çözer.

Modern üretken AI'nın temel tekniği.

2. Domain adaptation

Bir veri setinden başka veri setine model aktarma. Wasserstein dağılımlar arası "taşıma" hesaplar.

3. Görüntü işleme

Görüntü hizalama, retargeting.

4. Doğal dil işleme

Kelime embeddings arası mesafe.

5. Histogram karşılaştırma

Renk, ses, doku.

6. Sigorta + finans

Risk dağılımları arası mesafe.

7. Biyoloji

Hücre yapı dağılımı karşılaştırma.

Sinkhorn algoritması

Wasserstein hesabı pahalı: doğrudan O(n3)O(n^3) veya daha kötü.

Sinkhorn algoritması (Cuturi 2013): entropi düzenli versiyon. GPU'da paraleldir, çok hızlı.

Modern OT (Optimal Transport) kütüphaneleri (POT, OTT-JAX) Sinkhorn kullanır.

Genelleştirmeler

WpW_p

Wp(P,Q)=(infπxypdπ)1/pW_p(P, Q) = \left(\inf_\pi \int |x-y|^p d\pi\right)^{1/p}

p=1p = 1: EMD. p=2p = 2: kuadratik (Gauss dağılımları için).

Gromov-Wasserstein

Farklı uzaylar arası dağılımlar. Şekil eşleştirme.

Sliced Wasserstein

Yüksek boyutta hızlı yaklaşıklık.

Unbalanced OT

Eşit ağırlık koşulunu gevşeten versiyon.

Felsefi anlamı

Optimal transport: "dağılımlar arası uygun dönüşüm". Modern matematik fiziği, AI, ekonomi — hepsi benzer soruyu sorar:

  • Birinden öbürüne nasıl geçeriz?
  • En az maliyet ne?

Wasserstein bu soruyu geometrik olarak cevaplar.

Modern alanlar

  • Riemann geometri: OT ve Riemann manifoldlar.
  • Mean field games: çok ajanlı oyun teorisi.
  • Diffusion models: modern üretken AI (Stable Diffusion, DALL-E).
  • JKO scheme: gradyan akışları olarak.

Sonuç

Wasserstein mesafesi:

  • "Kum tepesi taşıma" metaforu — sezgisel ve derin.
  • Monge (1781), Kantorovich (1942), Villani (2000'ler) evrim.
  • WGAN, domain adaptation, görüntü işleme modern uygulamalar.
  • Sinkhorn algoritması ile pratik hız.
  • Klasik KL divergence'ın geometrik halefi.

Modern AI ve matematik fiziğinin kavşağı. Optimal transport teorisi 21. yüzyıl matematiğinin en aktif alanlarından.

"Dağılımlar arası mesafe, optimum taşıma maliyetidir." OT'nin paradigması.

Etiketler

Wasserstein mesafesioptimal transportolasılıkGANmodern AI

Kendinizi Test Edin

Cevaplarınız profilinizde istatistik olarak saklanır.

1. Wasserstein mesafesi neyi ölçer?

2. Wasserstein KL divergence'tan niçin daha iyi?

3. Optimal transport problemi ilk kim formüle etti?

4. WGAN ne yapar?

5. Sinkhorn algoritması neyi sağlar?