Backpropagation: Derin Öğrenmeyi Mümkün Kılan Zincir Kuralı
Çok katlı sinir ağında milyonlarca parametre var. **Her birine** gradyan nasıl hesaplanır? Cevap: **kalkülüsteki zincir kuralı**, ama akıllı sırada uygulanmış. Modern AI'nin sessiz mucizesi.

Milyonlarca parametreye gradyan?
GPT-4: yaklaşık 1.8 trilyon parametre. Her birinin gradyanı (loss'a göre türev) gerekiyor — eğitimin her adımında.
Eğer her parametreyi ayrı ayrı sayısal türev ile hesaplarsanız: 1.8 trilyon kere ağı çalıştırın → imkansız.
Çözüm: backpropagation (geri yayılım). Zincir kuralı'nın akıllı düzeniyle, tek bir geri-geçişte tüm gradyanlar hesaplanır.
Bu, modern derin öğrenmenin mucize algoritmasıdır.
Sinir ağı: forward pass
Tek bir nöron:
= aktivasyon fonksiyonu (sigmoid, ReLU, tanh).
Çok katlı:
Forward pass: girdiden çıkışa hesapla. Tahmin , loss .
Zincir kuralı
Kalkülüsten:
Backpropagation'ın özü: gradyanları arkadan öne doğru, zincir kuralıyla, tek bir geçişte hesaplamak.
Algoritma
- Forward pass: aktivasyonları sakla.
- Loss'u hesapla.
- Backward pass: çıkıştan girişe doğru:
- Hata sinyalini geriye taşı.
- Her parametre için gradyanı zincir kuralı ile hesapla.
Karmaşıklık: forward pass kadar — yani doğrusal parametre sayısına. Sayısal türevin trilyonda biri.
Klasik örnek
3-katlı ağ:
Gradyanlar (zincir kuralıyla):
Sonra:
Bir geri-geçişte hepsi.
Tarihsel köken
Backpropagation bağımsız olarak birden fazla kez keşfedildi:
- Henry Kelley (1960): kontrol teorisi.
- Arthur Bryson (1961): mühendislik.
- Stuart Dreyfus (1962): dinamik optimizasyon.
- Paul Werbos (1974, PhD tezi): sinir ağları bağlamı.
- Rumelhart, Hinton, Williams (1986): popüler hale getirdi.
Werbos'un 1974 tezi sinir ağları için backpropagation'ı tanıttı, ama akademik camia dikkate almadı. Rumelhart-Hinton-Williams 1986 makalesi (Nature) tüm dünyaya yaydı.
Niçin 60'lardan sonra bekledi?
- Bilgisayarlar yetersizdi: 1960'larda CPU'lar yavaş, sinir ağları için yetersiz.
- Sinir ağları gözden düşmüştü: Minsky-Papert 1969 sonrası AI kışı.
- Veri eksik: büyük veri setleri 90'lardan sonra.
1980'ler sonrası iki rejim birleşti:
- Donanım: hızlı CPU, sonra GPU.
- Yazılım: backpropagation kütüphaneleri.
Sonuç: 2010'larda derin öğrenme patladı.
Otomatik türev (Autograd)
Modern derin öğrenme kütüphaneleri (PyTorch, TensorFlow, JAX) otomatik türev kullanır:
- Forward pass: hesaplama grafiği oluştur.
- Backward pass: grafiği geriye doğru dolaş, zincir kuralı uygula.
Programcı gradyanı manuel hesaplamaz — kütüphane otomatik yapar.
Bu, derin öğrenmenin erişilebilir olmasını sağladı. Önceden her ağ yapısı için el ile gradyan formülü gerekirdi.
Hata patlaması ve kaybolması
Backpropagation'ın bir sorunu: gradyan kaybolması/patlaması.
Çok katlı ağda zincir kuralı çarpımlar üretir. Eğer çoğu çarpan < 1 → gradyan kaybolur. > 1 → patlar.
Modern çözümler:
- ReLU aktivasyonu: sigmoid yerine, gradyan korur.
- Batch normalization, layer normalization: normalleştirme.
- Residual connections (ResNet): gradyanın "shortcut" yolu.
- Initialization (Xavier, He): dikkatli başlangıç.
Modern uygulamalar
Her büyük AI modeli backpropagation ile eğitildi:
- GPT-4, Claude, Gemini: dil modelleri.
- AlexNet, ResNet, ViT: görüntü modelleri.
- AlphaGo, AlphaZero: oyun AI'leri.
- Stable Diffusion, DALL-E: görüntü üretim.
Sonuç
Backpropagation:
- Zincir kuralının akıllı düzeni.
- Werbos (1974), Rumelhart-Hinton-Williams (1986) keşfi.
- Forward pass karmaşıklığında tüm gradyanları hesaplar.
- Modern derin öğrenmenin sessiz mucizesi.
- Otomatik türev'in temeli.
Bir tek kalkülüs kuralı: . Newton ve Leibniz'in 17. yüzyıldaki keşfi. 350 yıl sonra, bir tek akıllı algoritma düzeniyle, modern AI mucizesinin kalbi.
"Zincir kuralı, ama geriye doğru." Modern derin öğrenmenin paradigma cümlesi.
Etiketler
Kendinizi Test Edin
Cevaplarınız profilinizde istatistik olarak saklanır.
1. Backpropagation'ın matematik temeli nedir?
2. Backpropagation'ı sinir ağları için ilk kim tanıttı?
3. Backpropagation'ın karmaşıklık avantajı nedir?
4. Gradyan kaybolması/patlaması problemi nasıl çözülür?
5. Modern AI sistemleri backpropagation'ı nasıl kullanır?
İlgili Yazılar
Sekreter Problemi: Hayatın En İyi Seçimini Yapmak için "%37 Kuralı"
Bir işe alma görüşmesi, bir ev arama süreci, hatta hayat arkadaşı seçimi… Hepsinin altında aynı klasik matematik problemi yatar. Cevap şaşırtıcı biçimde tek bir sayıya bağlıdır: %37.
MatematikPisagor Teoremi ve Saklı Bir Sır: İrrasyonel Sayılar Nasıl Keşfedildi?
Dik üçgenlerle ilgili o ünlü kural, aynı zamanda matematik tarihinin en sarsıcı keşfine yol açtı: kesir olarak yazılamayan sayılar. Üstelik bu keşif, bir bilim topluluğunu temellerinden sarstı.
MatematikFibonacci Dizisi ve Altın Oran: Tavşanlardan Ayçiçeklerine Uzanan Örüntü
Bir tavşan üretme bilmecesiyle başlayan basit bir sayı dizisi, ayçiçeği tohumlarından çam kozalaklarına, deniz kabuklarından galaksilere kadar doğanın her yerinde nasıl karşımıza çıkıyor?