Curriculum Learning: Çocuk Gibi AI'ı Eğitmek
Bebek "kedi" demeden önce sesleri öğrenir. Modern AI eğitiminde de aynı: kolay → zor sıralama, performansı artırır.

"Çocuğa nasıl matematik öğretirsin?"
Önce:
- Sayma (1, 2, 3...).
- Sonra toplama.
- Sonra çıkarma.
- Sonra çarpma.
- Sonra cebir.
Her adım önceki üzerine kurulu. Müfredat (curriculum).
Modern AI eğitiminin önemli sorularından biri: bu insan müfredatından AI eğitimi için ders alabilir mi?
Cevap: Evet. Buna curriculum learning denir.
Akademik temeli (Bengio 2009)
Yoshua Bengio ve ark. 2009'da "Curriculum Learning" makalesini yayımladı. Tez:
"Modeli kolay örneklerle eğitmeye başla. Sonra zor örneklere geç. Bu, optimizasyon daha kolay yapar ve performansı artırır."
Bu klasik akademik makale modern AI'da yeniden önem kazanıyor.
Nasıl çalışır
Algoritmik olarak:
- Veri setini zorluk açısından sırala.
- Önce kolay örneklerle eğit.
- Kademeli olarak zor örnekleri ekle.
- Sonunda tüm veri ile eğit.
Zorluk ölçümü:
- Manuel: İnsan etiketleyici işaretler.
- Model bazlı: Modelin kayıp değerine göre.
- Heuristik: Kısa cümle = kolay, vb.
Pratik etki
Curriculum learning faydaları:
- Daha hızlı yakınsama: Eğitim zaman tasarrufu.
- Daha iyi performans: Bazı görevlerde %5-15 iyileşme.
- Daha kararlı eğitim: Vanishing/exploding gradient azalır.
- Daha az veri gerek: Aynı performans daha az örnekle.
Modern LLM eğitiminde standart pratik.
Modern uygulamalar
LLM pre-training
Llama 3: Eğitim aşamaları:
- İlk: Common Crawl (genel).
- Sonra: Kitap, makaleler (yüksek kalite).
- Son: Kod, matematik (özel).
Bu kademeli yaklaşım curriculum learning örneği.
Code AI
Codex, CodeLlama: Kolay scriptlerden karmaşık projelere.
Matematik AI
AlphaProof: Lise düzeyi → IMO düzeyi.
Robotik
Simülasyon → gerçek dünya geçiş.
"Anti-curriculum" tartışması
İlginç keşif: bazen zor örnekleri önce vermek daha iyi. Buna anti-curriculum denir.
Sebep: model dengelenmemiş veriye dayanıklı olmayı öğrenir. Genel performansta iyileşme.
Modern eğitim karma kullanır:
- Bazı görevler için curriculum.
- Bazı için anti-curriculum.
- Bazı için karışık.
Hard example mining
Modern varyasyon: hard example mining. Modelin en zor bulduğu örnekleri sık göster.
Sebep: kolay örnekler boşa hesap. Zor örnekler öğrenmenin merkezi.
Bu yaklaşım modern active learning ile birleşir.
Sentetik curriculum
Self-Instruct, Evol-Instruct: AI kendi müfredatını üretir. Modelin şu anki kapasitesine göre zor örnekler üretir.
Bu, adaptive curriculum. Modern instruction tuning paradigması.
Sade ders
Curriculum learning hikâyesinden iki şey:
- AI eğitimi insan eğitimine benzer. Müfredat, kademeli zorluk, tekrar — hepsi modern AI'da işe yarar. Pedagoji + AI birleşimi değerli.
- Optimum sıra bağımsız değildir. Bazı görevler için kolay→zor, bazı için anti, bazı için karma. Modern AI eğitimi sanat.
Bağlam
Bengio için: [[yoshua-bengio-derin-ogrenmenin-uc-buyuklerinden]] (varsa). Self-Instruct için: [[self-instruct-modelin-kendi-egitim-verisini-uretmesi]]. Pre-training verisi için: [[pre-training-veri-llm-in-bilgisinin-tek-kaynagi]]. AlphaProof için: [[alphaproof-ai-matematik-olimpiyatinda-gumus-madalyaya]]. Sutton ve RL için: [[rich-sutton-pekistirmeli-ogrenmenin-baba-figuru-ve-bitter-lesson]].
Etiketler
Kendinizi Test Edin
Cevaplarınız profilinizde istatistik olarak saklanır.
1. Curriculum learning ne yapar?
2. Curriculum learning faydaları nedir?
3. Anti-curriculum nedir?
4. Hard example mining nedir?
5. Adaptive curriculum nedir?
İlgili Yazılar
Sekreter Problemi: Hayatın En İyi Seçimini Yapmak için "%37 Kuralı"
Bir işe alma görüşmesi, bir ev arama süreci, hatta hayat arkadaşı seçimi… Hepsinin altında aynı klasik matematik problemi yatar. Cevap şaşırtıcı biçimde tek bir sayıya bağlıdır: %37.
MatematikPisagor Teoremi ve Saklı Bir Sır: İrrasyonel Sayılar Nasıl Keşfedildi?
Dik üçgenlerle ilgili o ünlü kural, aynı zamanda matematik tarihinin en sarsıcı keşfine yol açtı: kesir olarak yazılamayan sayılar. Üstelik bu keşif, bir bilim topluluğunu temellerinden sarstı.
MatematikFibonacci Dizisi ve Altın Oran: Tavşanlardan Ayçiçeklerine Uzanan Örüntü
Bir tavşan üretme bilmecesiyle başlayan basit bir sayı dizisi, ayçiçeği tohumlarından çam kozalaklarına, deniz kabuklarından galaksilere kadar doğanın her yerinde nasıl karşımıza çıkıyor?