- Ratenlimits und Kosten proaktiv verwalten
- Intelligente Modell-Routing-Entscheidungen treffen
- Prompts auf eine bestimmte Länge optimieren
Wie man Nachrichten-Token zählt
Der Token-Zählung Endpunkt akzeptiert dieselbe strukturierte Liste von Eingaben zum Erstellen einer Nachricht, einschließlich Unterstützung für System-Prompts, Tools, Bilder und PDFs. Die Antwort enthält die Gesamtanzahl der Eingabe-Token.Die Token-Anzahl sollte als Schätzung betrachtet werden. In einigen Fällen kann sich die tatsächliche Anzahl der verwendeten Eingabe-Token beim Erstellen einer Nachricht um einen kleinen Betrag unterscheiden.Token-Anzahlen können Token enthalten, die automatisch von Anthropic für Systemoptimierungen hinzugefügt wurden. Sie werden nicht für systemseitig hinzugefügte Token berechnet. Die Abrechnung spiegelt nur Ihren Inhalt wider.
Unterstützte Modelle
Alle aktiven Modelle unterstützen Token-Zählung.Token in einfachen Nachrichten zählen
JSON
Token in Nachrichten mit Tools zählen
Server-Tool Token-Anzahlen gelten nur für den ersten Sampling-Aufruf.
JSON
Token in Nachrichten mit Bildern zählen
JSON
Token in Nachrichten mit erweitertem Denken zählen
Siehe hier für weitere Details darüber, wie das Kontextfenster mit erweitertem Denken berechnet wird
- Denkblöcke aus vorherigen Assistenten-Durchgängen werden ignoriert und zählen nicht zu Ihren Eingabe-Token
- Aktuelles Assistenten-Durchgang-Denken zählt doch zu Ihren Eingabe-Token
JSON
Token in Nachrichten mit PDFs zählen
Token-Zählung unterstützt PDFs mit denselben Einschränkungen wie die Messages API.
JSON
Preise und Ratenlimits
Token-Zählung ist kostenlos zu verwenden, unterliegt aber Anfragen pro Minute Ratenlimits basierend auf Ihrer Nutzungsstufe. Wenn Sie höhere Limits benötigen, kontaktieren Sie den Vertrieb über die Claude Console.| Nutzungsstufe | Anfragen pro Minute (RPM) |
|---|---|
| 1 | 100 |
| 2 | 2,000 |
| 3 | 4,000 |
| 4 | 8,000 |
Token-Zählung und Nachrichtenerstellung haben separate und unabhängige Ratenlimits — die Nutzung des einen zählt nicht gegen die Limits des anderen.
FAQ
Verwendet Token-Zählung Prompt-Caching?
Verwendet Token-Zählung Prompt-Caching?
Nein, Token-Zählung bietet eine Schätzung ohne Verwendung von Caching-Logik. Obwohl Sie
cache_control Blöcke in Ihrer Token-Zählung-Anfrage bereitstellen können, erfolgt Prompt-Caching nur während der tatsächlichen Nachrichtenerstellung.