Context Window (Bağlam Penceresi) Nedir, Nasıl Çalışır?
Context window (bağlam penceresi), bir yapay zeka modelinin aynı anda işleyebildiği token miktarıdır. Nasıl çalıştığını, limitlerini ve sınırlarını öğrenin.

TL;DR: Context window (bağlam penceresi), bir büyük dil modelinin aynı anda "görebildiği" ve hesaba katabildiği metin miktarıdır; token denen birimlerle ölçülür. Modelin çalışan belleği gibidir: konuşmanın başındaki bir detayı hatırlayıp hatırlayamayacağını belirler. 2026 itibarıyla pencereler 200.000 token'dan 10 milyon token'a kadar uzanır, ancak ilan edilen boyut her zaman pratikte kullanılan boyut değildir.
Context window (bağlam penceresi) nedir?
Context window, bir yapay zeka modelinin tek bir istek sırasında işleyebildiği toplam metnin (girdi + çıktı) token cinsinden üst sınırıdır. Türkçesi bağlam penceresidir ve modelin o anki "lookback" yani geriye bakış kapasitesini tanımlar.
Bunu modelin kısa süreli hafızası olarak düşünebilirsiniz. Pencereye sığan her şey modelin dikkate alabileceği bilgidir; pencerenin dışında kalan her şey ise model için yok gibidir. IBM'in tanımıyla context window, modelin "bir konuşmayı, önceki detayları unutmadan ne kadar uzun sürdürebileceğini" belirler.
Token nedir? Token, metnin modele verilen en küçük parçasıdır. İngilizcede bir token kabaca 4 karaktere ya da bir kelimenin dörtte üçüne denk gelir. Pratik bir çeviri: yaklaşık 100.000 token, 75.000 kelimeye ya da 250 sayfalık bir kitaba karşılık gelir.
Context window nasıl çalışır?
Bir modele yazı yazdığınızda, metniniz önce token'lara bölünür. Model bu token dizisini okur ve bir sonraki token'ı tahmin ederek yanıt üretir. Tüm bu işlem — sizin sorunuz, varsa önceki mesajlar ve modelin ürettiği cevap — aynı pencerenin içinde sayılır.
Pencere dolduğunda iki şeyden biri olur: ya istek reddedilir ya da en eski mesajlar "kaydırılarak" pencereden düşürülür. İşte bir sohbet botunun uzun bir konuşmanın başını "unutmasının" teknik nedeni budur.
Context window modelin dikkat (attention) bütçesidir. Pencere büyüdükçe bu bütçe daha çok token'a yayılır; 1.000 token'da güçlü dikkat çeken bir bilgi, 100.000 token içinde işlevsel olarak göz ardı edilebilir.
Önemli bir nokta: context window kalıcı bir hafıza değildir. Her yeni istek temiz bir sayfayla başlar. Modelin geçmiş konuşmaları hatırlaması için bu geçmişin her seferinde pencereye yeniden konması gerekir. Bu sınırı aşmanın yolları arasında RAG (Retrieval-Augmented Generation) ve iyi tasarlanmış prompt mühendisliği gelir.
Hangi modelin context window'u ne kadar?
Context window boyutları son iki yılda hızla büyüdü. Aşağıda 2025–2026 dönemindeki öne çıkan modeller yer alıyor:
| Model | Context Window | Yaklaşık karşılığı |
|---|---|---|
| Llama 4 Scout | 10.000.000 token | ~7,5 milyon kelime |
| Gemini 2.5 / 3 Pro | 1–2 milyon token | ~750 bin–1,5 milyon kelime |
| Claude Sonnet 4 | 200.000 (1M beta) token | ~150 bin kelime |
| GPT-5 | 400.000 token | ~300 bin kelime |
| Gemini 3 Flash | 200.000 token | ~150 bin kelime |
Bu rakamlar girdi ile çıktının toplamı için geçerlidir ve modelin sürümüne göre değişebilir. Genel eğilim açık: milyon token'lık pencereler artık üretim ortamında kullanılabilir durumda.
Context window ile token'ın temelini daha derin merak ediyorsanız, büyük dil modeli (LLM) nedir yazımız iyi bir başlangıç noktasıdır.
Büyük context window neden her zaman daha iyi değil?
Daha büyük pencere çekici görünür, ama iki gerçek bu cazibeyi dengeler:
- İlan edilen ≠ etkili boyut. Bağımsız ölçümler, 200.000 token iddia eden modellerin çoğunlukla 130.000 token civarında güvenilmez hâle geldiğini gösteriyor. Etkili kapasite genellikle ilan edilenin %60–70'i kadardır.
- "Ortada kaybolma" (lost in the middle). Stanford ve UC Berkeley araştırmacıları, modellerin bağlamın başına ve sonuna iyi, ortasına kötü dikkat ettiğini belgeledi. İlgili bilgi ortaya konduğunda doğruluk %30'dan fazla düşebiliyor; baş ve son bölümler %85–95 doğruluk gösterirken orta bölüm %76–82'ye iniyor.
Bir de maliyet var. Dikkat mekanizmasının hesaplama yükü karesel (quadratic) büyür. Pratikte bu, 100.000 token'lık bir bağlamın 10.000 token'lık bir bağlamdan yaklaşık 50 kat daha pahalıya mal olabileceği anlamına gelir.
İlan edilen büyük pencere, dolduran her token'ın gerçekten okunduğu anlamına gelmez. Doğru token'ları seçmek, çok token koymaktan çoğu zaman daha değerlidir.
Context window mı, RAG mi?
"Pencere yeterince büyükse her şeyi içine atarım" düşüncesi sezgisel ama çoğu durumda yanlış. Pratikte iki yaklaşım birbirini tamamlar:
| Kıstas | Büyük context window | RAG |
|---|---|---|
| Veri büyüklüğü | Pencereye sığan kadar | Sınırsız (harici depo) |
| Maliyet | Token başına yüksek | Yalnız ilgili parçalar |
| Gecikme | Uzun bağlamda yavaş | Genelde daha hızlı |
| Güncellik | Statik (isteğe bağlı) | Gerçek zamanlı veri |
Araştırmalar bunu net gösteriyor: sıralı seçilmiş 48.000 token'lık bir RAG yaklaşımı, 117.000 token'lık tam bağlam yaklaşımını standart testlerde 13 F1 puan geride bırakabiliyor — üstelik token bütçesinin yaklaşık yedide biriyle. Bugün ciddi yapay zeka uygulamalarının çoğu için kazanan kalıp, RAG ile orta-uzun bağlamlı bir modelin birlikte kullanılmasıdır.
Sıkça Sorulan Sorular
Context window ile token aynı şey mi? Hayır. Token metnin en küçük işlem birimidir; context window ise modelin aynı anda işleyebildiği maksimum token sayısıdır. Yani pencere bir kapasite, token ise o kapasiteyi dolduran birimdir.
1 milyon token kaç kelime eder? Kabaca 750.000 kelime, yani yaklaşık 2.500 sayfalık bir kitap. Türkçede kelime başına düşen token sayısı İngilizceden biraz daha yüksek olabilir, bu yüzden gerçek kelime sayısı bir miktar düşebilir.
Context window dolarsa ne olur? Model ya isteği reddeder ya da en eski mesajları pencereden düşürür. Bu yüzden uzun sohbetlerde model konuşmanın başındaki detayları "unutmuş" gibi davranabilir.
Daha büyük context window her zaman daha iyi midir? Hayır. "Ortada kaybolma" etkisi, ilan edilen ile etkili boyut farkı ve karesel artan maliyet nedeniyle, gereğinden büyük bir pencereyi doldurmak hem pahalı hem de doğruluğu düşürücü olabilir.
Context window kalıcı hafıza mıdır? Değildir. Her yeni istek sıfırdan başlar; modelin geçmişi hatırlaması için o geçmişin her seferinde pencereye yeniden eklenmesi gerekir.
Kaynaklar: IBM — What is a context window?, Stanford/UC Berkeley — Lost in the Middle, MindStudio — 1M Token Context vs RAG
