Question 1

Token tam olarak nedir?

Accepted Answer

Token, modelin bir birim olarak işlediği metin parçasıdır. Çoğu İngilizce metin için bir token yaklaşık 3-4 karakter veya yaklaşık 0,75 kelimeye karşılık gelir. 'the', 'is' ve 'and' gibi yaygın kelimeler tipik olarak birer token'dır. Nadir kelimeler, özel isimler ve kod tanımlayıcıları genellikle birden çok token'a bölünür. Boşluk, noktalama işaretleri ve yeni satırlar da token tüketir. Tam sınırlar, modelin kullandığı tokenizer'a bağlıdır.

Question 2

Token'lar API maliyeti için neden önemlidir?

Accepted Answer

LLM API fiyatlandırması, tipik olarak girdi token'ları ve çıktı token'ları için ayrı oranlarla token sayısına dayanır. Çıktı token'ları genellikle girdi token'larından 3-5 kat daha pahalıdır. 100 token daha uzun bir prompt, her API çağrısında daha fazla maliyete yol açar. Günde binlerce çağrı yapıyorsanız bu hızla birikir. Bir prompt'u üretime dağıtmadan önce token sayısını ölçmek, beklenmedik şekilde uzun sistem prompt'larını yakalamanıza ve aylık maliyetleri doğru bir şekilde tahmin etmenize yardımcı olur.

Question 3

Token'lar nasıl sayılır: her model aynı yöntemi mi kullanır?

Accepted Answer

Hayır. Her model ailesi kendi tokenizer'ını kullanır. GPT-3.5 ve GPT-4, cl100k_base (yaklaşık 100.000 token'lık bir kelime dağarcığı) kullanır. GPT-4o ve GPT-4o-mini, daha büyük bir kelime dağarcığına (yaklaşık 200.000 token) sahip olan o200k_base kullanır ve aynı metni daha az token'da kodlama eğilimindedir. Claude kendi tokenizer'ını kullanır, bu da yine farklılık gösterir. Gemini modelleri SentencePiece kullanır. Aynı metin, GPT-4'te 120 token ve GPT-4o'da 105 token olarak sayılabilir. Dağıttığınız modelle eşleşen tokenizer'ı her zaman kullanın.

Question 4

Bağlam penceresi nedir ve token'larla nasıl ilişkilidir?

Accepted Answer

Bağlam penceresi, bir modelin tek bir istekte işleyebileceği maksimum token sayısıdır; hem girdi (prompt + konuşma geçmişi + belgeler) hem de çıktı birleştirilir. GPT-4o'nun 128.000 token bağlam penceresi vardır; Claude 3.5 Sonnet 200.000 token'a kadar destekler. Girdiniz bağlam penceresini aşarsa API bir hata döndürür. Pratikte bağlam penceresi bir bütçedir: girdi token'ları, çıktı token'ları ve eklenen belgelerin tümü aynı havuzdan çekilir.

Model	Girdi (1M token başına)	Çıktı (1M token başına)
GPT-4o	$2.50	$10.00
GPT-4o-mini	$0.15	$0.60
Claude 3.5 Sonnet	$3.00	$15.00
Claude 3 Haiku	$0.25	$1.25
Gemini 1.5 Flash	$0.075	$0.30

Bileşen	Tipik tahsis
Sistem prompt’u	100 ila 500 token
Konuşma geçmişi (son N tur)	2.000 ila 20.000 token
Eklenen belgeler / RAG bağlamı	5.000 ila 50.000 token
Çıktı için ayrılan	1.000 ila 4.000 token

ChatGPT Prompt Token Sayacı: Token Hesaplama Aracı

Token Sayısı

Metin İstatistikleri

Tahmini Maliyet

İlgili Araçlar

Örnek Prompt

Token Nedir?

Token Sayısı Neden Önemlidir

API maliyeti

Bağlam penceresi sınırları

Yanıt kalitesi

Farklı Tokenizer’lar Aynı Metni Nasıl İşler?

Token Sayısını Azaltmak İçin Pratik Teknikler

Boşluk ve fazlalığı kırpın

Veriler için yapılandırılmış formatlar kullanın

Statik talimatlar için sistem prompt’larını tercih edin

Tekrarlanan bağlamı önbelleğe alın

Bütçe Olarak Bağlam Penceresi