Die Kontextbearbeitung befindet sich derzeit in der Beta-Phase mit Unterstützung für das Löschen von Tool-Ergebnissen. Um sie zu aktivieren, verwenden Sie den Beta-Header
context-management-2025-06-27
in Ihren API-Anfragen. Zusätzliche Kontextbearbeitungsstrategien werden in zukünftigen Versionen hinzugefügt.Bitte wenden Sie sich über unser Feedback-Formular an uns, um Ihr Feedback zu dieser Funktion zu teilen.Wie es funktioniert
Dieclear_tool_uses_20250919
-Strategie löscht Tool-Ergebnisse, wenn der Gesprächskontext über Ihren konfigurierten Schwellenwert hinauswächst. Wenn aktiviert, löscht die API automatisch die ältesten Tool-Ergebnisse in chronologischer Reihenfolge und ersetzt sie durch Platzhaltertext, um Claude zu informieren, dass das Tool-Ergebnis entfernt wurde. Standardmäßig werden nur Tool-Ergebnisse gelöscht. Sie können optional sowohl Tool-Ergebnisse als auch Tool-Aufrufe (die Tool-Verwendungsparameter) löschen, indem Sie clear_tool_inputs
auf true setzen.
Die Kontextbearbeitung macht zwischengespeicherte Prompt-Präfixe ungültig, da das Löschen von Inhalten die Prompt-Struktur verändert und die Übereinstimmungsanforderung für Cache-Treffer bricht. Um dies zu berücksichtigen, empfehlen wir, genügend Token zu löschen, um die Cache-Invalidierung lohnenswert zu machen. Verwenden Sie den clear_at_least
-Parameter, um sicherzustellen, dass jedes Mal eine Mindestanzahl von Token gelöscht wird. Bei der Verwendung von Prompt-Caching mit Kontextbearbeitung entstehen Ihnen Cache-Schreibkosten jedes Mal, wenn Inhalte gelöscht werden, aber nachfolgende Anfragen können das neu zwischengespeicherte Präfix wiederverwenden.
Unterstützte Modelle
Die Kontextbearbeitung ist verfügbar auf:- Claude Opus 4.1 (
claude-opus-4-1-20250805
) - Claude Opus 4 (
claude-opus-4-20250514
) - Claude Sonnet 4.5 (
claude-sonnet-4-5-20250929
) - Claude Sonnet 4 (
claude-sonnet-4-20250514
)
Grundlegende Verwendung
Der einfachste Weg, die Kontextbearbeitung zu aktivieren, ist, nur den Strategietyp anzugeben, da alle anderen Konfigurationsoptionen ihre Standardwerte verwenden werden:Erweiterte Konfiguration
Sie können das Verhalten der Kontextbearbeitung mit zusätzlichen Parametern anpassen:Konfigurationsoptionen
Konfigurationsoption | Standard | Beschreibung |
---|---|---|
trigger | 100.000 Input-Token | Definiert, wann die Kontextbearbeitungsstrategie aktiviert wird. Sobald der Prompt diesen Schwellenwert überschreitet, beginnt das Löschen. Sie können diesen Wert entweder in input_tokens oder tool_uses angeben. |
keep | 3 Tool-Verwendungen | Definiert, wie viele aktuelle Tool-Verwendungs-/Ergebnis-Paare nach dem Löschen behalten werden sollen. Die API entfernt zuerst die ältesten Tool-Interaktionen und bewahrt die neuesten auf. |
clear_at_least | Keine | Stellt sicher, dass jedes Mal eine Mindestanzahl von Token gelöscht wird, wenn die Strategie aktiviert wird. Wenn die API nicht mindestens die angegebene Menge löschen kann, wird die Strategie nicht angewendet. Dies hilft zu bestimmen, ob das Löschen des Kontexts es wert ist, Ihren Prompt-Cache zu brechen. |
exclude_tools | Keine | Liste von Tool-Namen, deren Tool-Verwendungen und -Ergebnisse niemals gelöscht werden sollen. Nützlich für die Bewahrung wichtigen Kontexts. |
clear_tool_inputs | false | Steuert, ob die Tool-Aufrufparameter zusammen mit den Tool-Ergebnissen gelöscht werden. Standardmäßig werden nur die Tool-Ergebnisse gelöscht, während Claudes ursprüngliche Tool-Aufrufe sichtbar bleiben. |
Antwortformat
Sie können sehen, welche Kontextbearbeitungen auf Ihre Anfrage angewendet wurden, indem Sie dascontext_management
-Antwortfeld verwenden, zusammen mit hilfreichen Statistiken über den gelöschten Inhalt und die Input-Token.
Response
message_delta
-Event enthalten sein:
Streaming Response
Token-Zählung
Der /v1/messages/count_tokens-Endpunkt unterstützt Kontextverwaltung und ermöglicht es Ihnen, eine Vorschau darauf zu erhalten, wie viele Token Ihr Prompt nach der Anwendung der Kontextbearbeitung verwenden wird.Response
input_tokens
) als auch die ursprüngliche Token-Anzahl vor dem Löschen (original_input_tokens
).