Tree of Thoughts: LLM'ye Dallanma Arama Eklemek
CoT bir zincir; ToT bir ağaç. Yao'nun 2023'te önerdiği, modern reasoning model paradigmasının teorik temellerinden biri.

CoT'nin sınırı
Chain-of-Thought (CoT) güçlü ama düz. Tek bir düşünce zinciri:
Adım 1 → Adım 2 → Adım 3 → Cevap
Eğer Adım 1 yanlışsa, geri kalan çöp. Model yanlış yola gider, geri dönmez.
İnsanlar farklı çalışır: birkaç yaklaşım dene, en iyisini seç, gerekirse geri dön. Bu aramadır.
Tree of Thoughts (ToT)
2023 Mayıs. Princeton'dan Shunyu Yao ve ark. "Tree of Thoughts: Deliberate Problem Solving with Large Language Models" makalesi.
Tez: CoT yerine ağaç araması yap:
- Her adımda birden fazla olası ara adım üret.
- Her birini değerlendir (model kendi ya da ayrı değerlendirici).
- En umut verici dalı genişlet.
- Çıkmaz sokak → geri dön.
Bu klasik AI'ın arama geleneğini modern LLM ile birleştirir.
Algoritma
ToT iki bileşene ayrılır:
1. Düşünce üretimi
Her adımda LLM'e sor: "Şu anki duruma göre olası birkaç sonraki düşünce nedir?"
Model 3-5 alternatif üretir. Her biri yeni bir dal.
2. Düşünce değerlendirmesi
Her dalı LLM'e değerlendirt: "Bu düşünce çözüme yakın mı?"
Skorlar: 1-10 ya da "umut verici / vasat / kötü."
3. Arama stratejisi
Klasik graf arama:
- BFS: Her seviyeyi tara, sonra ilerle.
- DFS: Bir dalı sonuna kadar dene, geri dön.
- Beam search: En iyi k dalı tut.
ToT genelde BFS + beam kullanır.
Örnekler
Game of 24
Klasik problem: 4 sayı + 4 operasyon. 24 elde et. Örnek: 4, 9, 10, 13.
CoT GPT-4: %4 başarı.
ToT GPT-4: %74. Dramatik fark.
Sebep: Game of 24'te çoğu yol çıkmaz sokaktır. ToT geri dönüp deneyebilir.
Yaratıcı yazma
Bir hikâye yaz, sonra birkaç plan üret, en iyisini seç, devam et.
ToT yaratıcı görevlerde de CoT'tan iyi.
Crosswords
Mini crossword problemlerinde %20 → %60.
Hesap maliyeti
ToT'nin bedeli: çok daha fazla token.
CoT: ~500 token.
ToT: ~5000-10000 token.
10-20x daha pahalı. Bu yüzden:
- Önemli görevler: ToT kullan.
- Sıradan sohbet: CoT yeter.
o1 ile bağlantı
Eylül 2024'te OpenAI o1'i tanıttı. Tam ToT değil, ama benzer prensip: test-time compute ile düşünme zamanı.
o1'in arkasındaki ana fikir: model uzun süre düşünür, birden çok düşünce zinciri üretir, en iyisini seçer.
ToT bunun açık akademik versiyonu. o1 daha karmaşık ama temel sezgi aynı.
Modern varyantlar
ToT'den sonra:
- Graph of Thoughts (2023): Ağaç değil graf — daha esnek.
- Algorithm of Thoughts (2023): Klasik algoritmaları LLM'e öğret.
- Beam search + reasoning: Üretim zamanı arama.
- Monte Carlo Tree Search + LLM: AlphaGo benzeri.
Bu çalışmalar modern reasoning model çağının akademik temelidir.
Sınırlamalar
ToT mükemmel değil:
- Pahalı. 10-20x maliyet.
- Değerlendirici güvenilmez. Model kendi düşüncelerini abartılı değerlendirir.
- Optimum bulmak zor. Lokal en iyi, global en iyi olmayabilir.
- Açık uçlu görevler için zor. "Doğru cevap" yoksa değerlendirme nasıl?
Bu yüzden ToT herkesin görevi değil, kritik akıl yürütme için.
Klasik benzetme
Bir labirente girdin. CoT yöntemi: "Sol git, sonra düz, sonra sağ, sonra..." Yanlış başlangıçsa kaybolursun.
ToT yöntemi: "Üç ayrı yola bak. Hangisi umut verici? Onu seç. Sonra tekrar üç yol. Çıkmaz sokak? Geri dön."
İnsan gibi arama. Daha yavaş ama daha güvenilir.
Sade ders
ToT hikâyesinden iki şey:
- Klasik AI fikirleri modern AI'da diriliyor. ToT, 1960'ların arama algoritmaları + 2020'lerin LLM'leri. Tarih yan yana çalışıyor.
- Düşünme zamanı kalite'dir. Daha çok hesap = daha iyi cevap. Bu, modern AI'ın test-time compute paradigmasının özüdür. o1, DeepSeek R1, Claude Extended Thinking — hepsi bu yönde.
Bağlam
CoT için: [[chain-of-thought-llm-leri-akil-yurutmeye-zorlamak]]. GRPO ve reasoning için: [[grpo-deepseek-in-akil-yurutme-icin-rl-algoritmasi]]. Test-time compute için: [[test-time-compute-aiya-dusunmek-icin-zaman-vermek]]. Klasik arama algoritmaları için: [[allen-newell-yapay-zekanin-bilissel-mimari]] (GPS). MCTS ile bağlantı: [[monte-carlo-tree-search-mcts-alphagonun-zekasinin-kalbi]].
Etiketler
Kendinizi Test Edin
Cevaplarınız profilinizde istatistik olarak saklanır.
1. ToT CoT'tan ne ile ayrılır?
2. Game of 24'te ToT vs CoT?
3. ToT'nin maliyeti nedir?
4. o1 ile ToT ilişkisi nedir?
5. ToT'nin temel sınırı nedir?
İlgili Yazılar
Sekreter Problemi: Hayatın En İyi Seçimini Yapmak için "%37 Kuralı"
Bir işe alma görüşmesi, bir ev arama süreci, hatta hayat arkadaşı seçimi… Hepsinin altında aynı klasik matematik problemi yatar. Cevap şaşırtıcı biçimde tek bir sayıya bağlıdır: %37.
MatematikPisagor Teoremi ve Saklı Bir Sır: İrrasyonel Sayılar Nasıl Keşfedildi?
Dik üçgenlerle ilgili o ünlü kural, aynı zamanda matematik tarihinin en sarsıcı keşfine yol açtı: kesir olarak yazılamayan sayılar. Üstelik bu keşif, bir bilim topluluğunu temellerinden sarstı.
MatematikFibonacci Dizisi ve Altın Oran: Tavşanlardan Ayçiçeklerine Uzanan Örüntü
Bir tavşan üretme bilmecesiyle başlayan basit bir sayı dizisi, ayçiçeği tohumlarından çam kozalaklarına, deniz kabuklarından galaksilere kadar doğanın her yerinde nasıl karşımıza çıkıyor?