Question 1

Bir sistem prompt'u bağlam penceresinin ne kadarını kullanmalı?

Accepted Answer

Etkileşimli sohbet uygulamaları için sistem prompt'larını toplam bağlam penceresinin yüzde 10 ila 15'inin altında tutun. 128k token bağlam penceresi ve 5000 token sistem prompt'u ile konuşma geçmişi ve yanıtlar için 123k token kalır. Konuşma geçmişinin birikmediği tek seferlik sınıflandırma veya çıkarma görevleri için daha uzun sistem prompt'ları daha az sorundur.

Question 2

Sistem prompt token'ları bir API çağrısının maliyetine dahil mi?

Accepted Answer

Evet. Bir API çağrısındaki tüm token'lar (sistem, kullanıcı, asistan ve araç sonucu mesajları) hem girdi token faturalandırmasına hem de hız sınırlarına dahildir. İstisna, prompt önbelleğe almadır: Anthropic veya OpenAI ile bir sistem prompt'unu önbelleğe alırsanız, aynı önbelleğe alınmış ön ek ile tekrarlanan çağrılar daha düşük bir oranda faturalandırılır (tipik olarak normal girdi token fiyatının yüzde 10 ila 25'i).

Question 3

Sistem prompt'umun token sayısını nasıl azaltabilirim?

Accepted Answer

Gereksiz talimatları kaldırın (iki kural aynı şeyi söylüyorsa birini tutun). Anlamı kaybetmeden daha kısa ifadeler kullanın. Few-shot örneklerini sistem prompt'undan ayrı bir mesaja veya bir getirme sistemine taşıyın. Araçların uzun açıklamalarını kısa parametre şemalarıyla değiştirin. Modelin eğitimden zaten bildiği bilgileri tekrarlamaktan kaçının.

Question 4

Prompt önbelleğe alma nedir ve sistem prompt'larına nasıl yardımcı olur?

Accepted Answer

Prompt önbelleğe alma, prompt'unuzun bir ön ekini (tipik olarak sistem prompt'u) önbelleklenebilir olarak işaretlemenize olanak tanır. Sağlayıcı, bu ön ek için KV önbelleğini saklar ve aynı ön ekin göründüğü sonraki çağrılarda yeniden kullanır. Anthropic, önbellek okumaları için normal girdi fiyatının yüzde 25'ini talep eder. OpenAI yüzde 50 talep eder. Kararlı bir sistem prompt'una sahip yüksek hacimli uygulamalar için bu, sistem prompt'u kısmındaki girdi maliyetlerini yüzde 50 ila 75 oranında kesebilir.

Model	Bağlam Penceresi
GPT-4o	128k token
GPT-4o mini	128k token
Claude 3.5 Sonnet	200k token
Claude 3 Haiku	200k token
Gemini 1.5 Pro	1M token
Gemini 1.5 Flash	1M token

Sistem Prompt Token Sayacı: Token Kullanımını Tahmin Etme

Token Sayısı

Metin İstatistikleri

Tahmini Maliyet

İlgili Araçlar

Sistem Prompt Token Sayacı

Bağlam Penceresi Bütçesini Anlama

Uygulama Türüne Göre Bütçe Kılavuzları

Etkileşimli sohbet ve ajanlar

Tek seferlik sınıflandırma ve çıkarma

Araç yoğun ajanlar

Token Azaltma Teknikleri

Gereksiz talimatları kaldırın

Ayrıntılı ifadeleri kısaltın

Örnekleri sistem prompt’undan çıkarın

Kısa araç şemaları kullanın

Prompt Önbelleğe Alma

Anthropic

OpenAI

Önbelleğe alma ne zaman önemlidir