ToT CoT'tan ne ile ayrılır?

Tek zincir değil, birden çok dal — arama ile çıkmaz sokak'tan geri dönüş

Game of 24'te ToT vs CoT?

CoT %4, ToT %74 — dramatik fark

ToT'nin maliyeti nedir?

10-20x daha çok token — pahalı

o1 ile ToT ilişkisi nedir?

o1 ToT'in karmaşık versiyonu — birden çok düşünce + seçim

ToT'nin temel sınırı nedir?

Açık uçlu görevlerde değerlendirme zor — "doğru cevap" tanımı belirsiz

Tree of Thoughts: LLM'ye Dallanma Arama Eklemek

CoT'nin sınırı

Chain-of-Thought (CoT) güçlü ama düz. Tek bir düşünce zinciri:

Adım 1 → Adım 2 → Adım 3 → Cevap

Eğer Adım 1 yanlışsa, geri kalan çöp. Model yanlış yola gider, geri dönmez.

İnsanlar farklı çalışır: birkaç yaklaşım dene, en iyisini seç, gerekirse geri dön. Bu aramadır.

Tree of Thoughts (ToT)

2023 Mayıs. Princeton'dan Shunyu Yao ve ark. "Tree of Thoughts: Deliberate Problem Solving with Large Language Models" makalesi.

Tez: CoT yerine ağaç araması yap:

Her adımda birden fazla olası ara adım üret.
Her birini değerlendir (model kendi ya da ayrı değerlendirici).
En umut verici dalı genişlet.
Çıkmaz sokak → geri dön.

Bu klasik AI'ın arama geleneğini modern LLM ile birleştirir.

Algoritma

ToT iki bileşene ayrılır:

1. Düşünce üretimi

Her adımda LLM'e sor: "Şu anki duruma göre olası birkaç sonraki düşünce nedir?"

Model 3-5 alternatif üretir. Her biri yeni bir dal.

2. Düşünce değerlendirmesi

Her dalı LLM'e değerlendirt: "Bu düşünce çözüme yakın mı?"

Skorlar: 1-10 ya da "umut verici / vasat / kötü."

3. Arama stratejisi

Klasik graf arama:

BFS: Her seviyeyi tara, sonra ilerle.
DFS: Bir dalı sonuna kadar dene, geri dön.
Beam search: En iyi k dalı tut.

ToT genelde BFS + beam kullanır.

Örnekler

Game of 24

Klasik problem: 4 sayı + 4 operasyon. 24 elde et. Örnek: 4, 9, 10, 13.

CoT GPT-4: %4 başarı.
ToT GPT-4: %74. Dramatik fark.

Sebep: Game of 24'te çoğu yol çıkmaz sokaktır. ToT geri dönüp deneyebilir.

Yaratıcı yazma

Bir hikâye yaz, sonra birkaç plan üret, en iyisini seç, devam et.

ToT yaratıcı görevlerde de CoT'tan iyi.

Crosswords

Mini crossword problemlerinde %20 → %60.

Hesap maliyeti

ToT'nin bedeli: çok daha fazla token.

CoT: ~500 token.
ToT: ~5000-10000 token.

10-20x daha pahalı. Bu yüzden:

Önemli görevler: ToT kullan.
Sıradan sohbet: CoT yeter.

o1 ile bağlantı

Eylül 2024'te OpenAI o1'i tanıttı. Tam ToT değil, ama benzer prensip: test-time compute ile düşünme zamanı.

o1'in arkasındaki ana fikir: model uzun süre düşünür, birden çok düşünce zinciri üretir, en iyisini seçer.

ToT bunun açık akademik versiyonu. o1 daha karmaşık ama temel sezgi aynı.

Modern varyantlar

ToT'den sonra:

Graph of Thoughts (2023): Ağaç değil graf — daha esnek.
Algorithm of Thoughts (2023): Klasik algoritmaları LLM'e öğret.
Beam search + reasoning: Üretim zamanı arama.
Monte Carlo Tree Search + LLM: AlphaGo benzeri.

Bu çalışmalar modern reasoning model çağının akademik temelidir.

Sınırlamalar

ToT mükemmel değil:

Pahalı. 10-20x maliyet.
Değerlendirici güvenilmez. Model kendi düşüncelerini abartılı değerlendirir.
Optimum bulmak zor. Lokal en iyi, global en iyi olmayabilir.
Açık uçlu görevler için zor. "Doğru cevap" yoksa değerlendirme nasıl?

Bu yüzden ToT herkesin görevi değil, kritik akıl yürütme için.

Klasik benzetme

Bir labirente girdin. CoT yöntemi: "Sol git, sonra düz, sonra sağ, sonra..." Yanlış başlangıçsa kaybolursun.

ToT yöntemi: "Üç ayrı yola bak. Hangisi umut verici? Onu seç. Sonra tekrar üç yol. Çıkmaz sokak? Geri dön."

İnsan gibi arama. Daha yavaş ama daha güvenilir.

Sade ders

ToT hikâyesinden iki şey:

Klasik AI fikirleri modern AI'da diriliyor. ToT, 1960'ların arama algoritmaları + 2020'lerin LLM'leri. Tarih yan yana çalışıyor.
Düşünme zamanı kalite'dir. Daha çok hesap = daha iyi cevap. Bu, modern AI'ın test-time compute paradigmasının özüdür. o1, DeepSeek R1, Claude Extended Thinking — hepsi bu yönde.

Bağlam

CoT için: [[chain-of-thought-llm-leri-akil-yurutmeye-zorlamak]]. GRPO ve reasoning için: [[grpo-deepseek-in-akil-yurutme-icin-rl-algoritmasi]]. Test-time compute için: [[test-time-compute-aiya-dusunmek-icin-zaman-vermek]]. Klasik arama algoritmaları için: [[allen-newell-yapay-zekanin-bilissel-mimari]] (GPS). MCTS ile bağlantı: [[monte-carlo-tree-search-mcts-alphagonun-zekasinin-kalbi]].