Question 1

Was genau ist ein Token?

Accepted Answer

Ein Token ist ein Textfragment, das das Modell als eine Einheit verarbeitet. Bei den meisten englischen Texten entspricht ein Token etwa 3-4 Zeichen oder etwa 0,75 Wörtern. Häufige Wörter wie 'the', 'is' und 'and' sind typischerweise jeweils ein Token. Seltene Wörter, Eigennamen und Codebezeichner werden normalerweise in mehrere Tokens aufgeteilt. Leerzeichen, Interpunktion und neue Zeilen verbrauchen ebenfalls Tokens. Die genauen Grenzen hängen vom Tokenizer ab, den das Modell verwendet.

Question 2

Warum sind Tokens wichtig für die API Kosten?

Accepted Answer

Der Preis von LLM APIs basiert auf der Anzahl der Tokens, typischerweise mit getrennten Tarifen für Eingabe- und Ausgabetokens. Ausgabetokens sind in der Regel 3 bis 5 Mal teurer als Eingabetokens. Ein 100 Tokens längerer Prompt kostet bei jedem API Aufruf mehr. Das summiert sich schnell, wenn du Tausende von Aufrufen pro Tag tätigst. Das Messen der Tokenanzahl vor dem Einsatz eines Prompts in der Produktion hilft, unerwartet lange System Prompts zu erkennen und die monatlichen Kosten genau abzuschätzen.

Question 3

Wie werden Tokens gezählt: Verwendet jedes Modell dieselbe Methode?

Accepted Answer

Nein. Jede Modellfamilie verwendet ihren eigenen Tokenizer. GPT-3.5 und GPT-4 verwenden cl100k_base (ein Vokabular von etwa 100.000 Tokens). GPT-4o und GPT-4o-mini verwenden o200k_base, das ein größeres Vokabular (etwa 200.000 Tokens) hat und denselben Text tendenziell in weniger Tokens codiert. Claude verwendet seinen eigenen Tokenizer, der sich wiederum unterscheidet. Die Gemini Modelle verwenden SentencePiece. Derselbe Text kann als 120 Tokens bei GPT-4 und 105 Tokens bei GPT-4o gezählt werden. Verwende immer den Tokenizer, der dem von dir eingesetzten Modell entspricht.

Question 4

Was ist ein Kontextfenster und wie verhält es sich zu Tokens?

Accepted Answer

Das Kontextfenster ist die maximale Anzahl von Tokens, die ein Modell in einer einzigen Anfrage verarbeiten kann, bestehend aus Eingabe (Prompt + Gesprächsverlauf + Dokumente) und Ausgabe. GPT-4o hat ein Kontextfenster von 128.000 Tokens; Claude 3.5 Sonnet unterstützt bis zu 200.000 Tokens. Wenn deine Eingabe das Kontextfenster überschreitet, gibt die API einen Fehler zurück. In der Praxis ist das Kontextfenster ein Budget: Eingabetokens, Ausgabetokens und alle eingefügten Dokumente verbrauchen denselben Pool.

Modell	Eingabe (pro 1M Tokens)	Ausgabe (pro 1M Tokens)
GPT-4o	2,50 USD	10,00 USD
GPT-4o mini	0,15 USD	0,60 USD
Claude 3.5 Sonnet	3,00 USD	15,00 USD
Gemini 1.5 Pro	1,25 USD	5,00 USD

ChatGPT Prompt Token Zähler: Token Berechnungstool

Tokenanzahl

Textstatistiken

Geschätzte Kosten

Verwandte Werkzeuge

Der Beispiel Prompt

Was ist ein Token?

Warum die Tokenanzahl Wichtig Ist

API Kosten

Kontextfenster Budgetierung