Chain of Thought (Düşünce Zinciri) Nedir, Nasıl Çalışır?

TL;DR: Chain of Thought (düşünce zinciri), bir yapay zeka modelinden doğrudan cevap istemek yerine, sonuca giden ara adımları tek tek açıklamasını isteyen bir prompt tekniğidir. Modeli "yüksek sesle düşünmeye" zorladığı için, özellikle matematik, mantık ve çok adımlı problemlerde doğruluğu ciddi biçimde artırır. Google araştırmacılarının 2022'deki çalışmasında bu yöntem, bazı testlerde doğruluğu %17'den %57'ye çıkarmıştır.

Chain of Thought (düşünce zinciri) nedir?

Chain of Thought, Türkçesiyle düşünce zinciri, büyük dil modellerinin bir problemi tek hamlede çözmek yerine, küçük ve sıralı mantık adımlarına bölerek çözmesini sağlayan bir prompt mühendisliği yöntemidir. Kısaca CoT olarak da anılır.

Klasik bir soruda model doğrudan nihai cevabı üretmeye çalışır. Düşünce zincirinde ise modelden önce akıl yürütme sürecini yazması, sonra sonuca varması istenir. Bu basit fark, modelin karmaşık problemlerdeki performansını çarpıcı şekilde değiştirir.

Örneğin "17 + 25 kaç eder?" sorusunu model şöyle çözebilir: önce (10 + 20) = 30, sonra (7 + 5) = 12, ardından 30 + 12 = 42. Adımları açığa çıkarmak, modelin hata yapma olasılığını azaltır.

Chain of Thought nasıl çalışır?

Düşünce zinciri, dil modelinin bir sonraki kelimeyi tahmin etme yönteminden faydalanır. Model her adımı metne döktüğünde, o adım sonraki tahminler için bir bağlam haline gelir. Yani model kendi yazdığı ara sonuçlar üzerine inşa ederek ilerler; bu da tek seferde cevap üretmeye kıyasla daha tutarlı bir muhakeme ortaya çıkarır.

CoT'u tetiklemenin iki temel yolu vardır:

Yöntem	Nasıl çalışır	Ne zaman kullanılır
Few-shot CoT	Prompt'a, çözümü adım adım gösterilmiş birkaç örnek konur	Karmaşık, alana özel görevlerde
Zero-shot CoT	Soruya "Adım adım düşünelim." gibi tek bir cümle eklenir	Hızlı, örneksiz kullanımda

Google ve diğer araştırmacılar 2022'de şaşırtıcı bir şey keşfetti: prompt'a hiç örnek koymadan yalnızca "Adım adım düşünelim" (Let's think step by step) cümlesini eklemek bile modelin doğruluğunu büyük ölçüde artırıyordu.

Bu zero-shot yaklaşımı, Kojima ve ekibinin çalışmasında InstructGPT modelinin MultiArith matematik testindeki başarısını %17,7'den %78,7'ye taşımıştır.

Chain of Thought neden bu kadar etkili?

Düşünce zinciri, 2022'de Jason Wei ve Google Research ekibinin "Chain-of-Thought Prompting Elicits Reasoning in Large Language Models" makalesiyle akademik literatüre girdi. Çalışmanın en çarpıcı bulgusu, devasa bir modelde (PaLM 540B) GSM8K matematik problemlerindeki doğruluğun standart yöntemle %17 iken, düşünce zinciriyle %57'ye yükselmesiydi.

Etkinin temel nedenleri şunlardır:

Problemi parçalara böler: Çok adımlı bir soruyu, her biri kolayca çözülebilen küçük adımlara ayırır.
Hesaplama yükünü dağıtır: Model tek bir tahminle her şeyi çözmek zorunda kalmaz; her adımda yalnız bir parçaya odaklanır.
Şeffaflık sağlar: Adımlar görünür olduğu için hatanın nerede yapıldığını fark etmek kolaylaşır.

Ancak kritik bir uyarı var: Düşünce zinciri yalnızca yeterince büyük modellerde (yaklaşık 100 milyar parametre üzeri) işe yarar. Daha küçük modeller çoğu zaman mantıksız düşünce zincirleri üretir ve bu, doğruluğu standart yöntemden bile aşağıya çeker. Bu özellik, dil modellerinin ölçek büyüdükçe ortaya çıkan "emergent" (beliren) yetenekleri arasında sayılır.

Chain of Thought nerelerde kullanılır?

Düşünce zinciri, tek adımlı bilgi sorularından çok muhakeme gerektiren görevlerde fark yaratır:

Matematik ve aritmetik: Çok aşamalı kelime problemleri.
Mantık ve sembolik akıl yürütme: Çıkarım zincirleri, bulmacalar.
Sağduyu muhakemesi: Neden-sonuç ilişkileri ve günlük yaşam senaryoları.
Kod ve hata ayıklama: Bir algoritmanın mantığını adım adım izleme.

Bugün OpenAI o1/o3, DeepSeek-R1 ve Claude'un genişletilmiş düşünme modu gibi "akıl yürüten modeller" (reasoning models), düşünce zincirini prompt'a elle eklemeye gerek kalmadan kendi içlerinde otomatik olarak üretir. Yani CoT, bugünün en güçlü modellerinin temel çalışma mantığına dönüşmüştür.

Düşünce zinciri her zaman doğru sonucu garanti etmez; model yanlış bir adımdan emin bir dille ilerleyip halüsinasyon üretebilir. Bu yüzden kritik kararlarda modelin adımları kontrol edilmelidir.

Sıkça Sorulan Sorular

Chain of Thought ile zero-shot CoT arasındaki fark nedir? Klasik (few-shot) Chain of Thought'ta prompt'a, çözümü adım adım gösterilmiş örnekler konur. Zero-shot CoT'ta ise hiç örnek verilmez; yalnızca soruya "Adım adım düşünelim." gibi kısa bir yönerge eklenerek modelin kendi muhakemesini yazması sağlanır.

Chain of Thought'u kendi prompt'larımda nasıl kullanırım? En basit yol, sorunuzun sonuna "Adım adım düşün ve gerekçeni açıkla." ifadesini eklemektir. Daha karmaşık görevlerde, beklediğiniz çözüm biçimini gösteren bir-iki örnek vermek (few-shot) sonucu daha da iyileştirir.

Her soru için düşünce zinciri kullanmalı mıyım? Hayır. Basit, tek adımlı bilgi sorularında CoT gereksiz uzunluk yaratır ve hız ile maliyeti artırır. En çok matematik, mantık ve çok aşamalı muhakeme gerektiren görevlerde fayda sağlar.

Modern akıl yürüten modellerde CoT'u elle yazmaya gerek var mı? Genellikle hayır. OpenAI o-serisi, DeepSeek-R1 ve Claude'un düşünme modu gibi modeller düşünce zincirini dahili olarak üretir. Yine de açık bir "adım adım açıkla" yönergesi, standart modellerde belirgin fayda sağlamayı sürdürür.