Die Kontextbearbeitung befindet sich derzeit in der Beta-Phase mit Unterstützung für das Löschen von Tool-Ergebnissen. Um sie zu aktivieren, verwenden Sie den Beta-Header
context-management-2025-06-27 in Ihren API-Anfragen. Zusätzliche Kontextbearbeitungsstrategien werden in zukünftigen Versionen hinzugefügt.Bitte wenden Sie sich über unser Feedback-Formular an uns, um Ihr Feedback zu dieser Funktion zu teilen.Wie es funktioniert
Dieclear_tool_uses_20250919-Strategie löscht Tool-Ergebnisse, wenn der Gesprächskontext über Ihren konfigurierten Schwellenwert hinauswächst. Wenn aktiviert, löscht die API automatisch die ältesten Tool-Ergebnisse in chronologischer Reihenfolge und ersetzt sie durch Platzhaltertext, um Claude mitzuteilen, dass das Tool-Ergebnis entfernt wurde. Standardmäßig werden nur Tool-Ergebnisse gelöscht. Sie können optional sowohl Tool-Ergebnisse als auch Tool-Aufrufe (die Tool-Verwendungsparameter) löschen, indem Sie clear_tool_inputs auf true setzen.
Kontextbearbeitung erfolgt serverseitigDie Kontextbearbeitung wird serverseitig angewendet, bevor der Prompt Claude erreicht. Ihre Client-Anwendung behält die vollständige, unveränderte Gesprächshistorie bei – Sie müssen Ihren Client-Status nicht mit der bearbeiteten Version synchronisieren. Verwalten Sie weiterhin Ihre vollständige Gesprächshistorie lokal wie gewohnt.
Kontextbearbeitung und Prompt-CachingDie Kontextbearbeitung macht gecachte Prompt-Präfixe ungültig, da das Löschen von Inhalten die Prompt-Struktur verändert und die Übereinstimmungsanforderung für Cache-Treffer bricht. Um dies zu berücksichtigen, empfehlen wir, genügend Token zu löschen, um die Cache-Invalidierung lohnenswert zu machen. Verwenden Sie den
clear_at_least-Parameter, um sicherzustellen, dass jedes Mal eine Mindestanzahl von Token gelöscht wird. Bei der Verwendung von Prompt-Caching mit Kontextbearbeitung entstehen Ihnen Cache-Schreibkosten jedes Mal, wenn Inhalte gelöscht werden, aber nachfolgende Anfragen können den neu gecachten Präfix wiederverwenden.Unterstützte Modelle
Die Kontextbearbeitung ist verfügbar für:- Claude Opus 4.1 (
claude-opus-4-1-20250805) - Claude Opus 4 (
claude-opus-4-20250514) - Claude Sonnet 4.5 (
claude-sonnet-4-5-20250929) - Claude Sonnet 4 (
claude-sonnet-4-20250514)
Grundlegende Verwendung
Der einfachste Weg, die Kontextbearbeitung zu aktivieren, ist nur den Strategietyp anzugeben, da alle anderen Konfigurationsoptionen ihre Standardwerte verwenden:Erweiterte Konfiguration
Sie können das Verhalten der Kontextbearbeitung mit zusätzlichen Parametern anpassen:Konfigurationsoptionen
| Konfigurationsoption | Standard | Beschreibung |
|---|---|---|
trigger | 100.000 Input-Token | Definiert, wann die Kontextbearbeitungsstrategie aktiviert wird. Sobald der Prompt diesen Schwellenwert überschreitet, beginnt das Löschen. Sie können diesen Wert entweder in input_tokens oder tool_uses angeben. |
keep | 3 Tool-Verwendungen | Definiert, wie viele aktuelle Tool-Verwendungs-/Ergebnispaare nach dem Löschen behalten werden sollen. Die API entfernt zuerst die ältesten Tool-Interaktionen und bewahrt die neuesten auf. |
clear_at_least | Keine | Stellt sicher, dass jedes Mal eine Mindestanzahl von Token gelöscht wird, wenn die Strategie aktiviert wird. Wenn die API nicht mindestens die angegebene Menge löschen kann, wird die Strategie nicht angewendet. Dies hilft zu bestimmen, ob das Löschen des Kontexts es wert ist, Ihren Prompt-Cache zu brechen. |
exclude_tools | Keine | Liste von Tool-Namen, deren Tool-Verwendungen und -Ergebnisse niemals gelöscht werden sollen. Nützlich für die Bewahrung wichtiger Kontexte. |
clear_tool_inputs | false | Steuert, ob die Tool-Aufrufparameter zusammen mit den Tool-Ergebnissen gelöscht werden. Standardmäßig werden nur die Tool-Ergebnisse gelöscht, während Claudes ursprüngliche Tool-Aufrufe sichtbar bleiben. |
Antwortformat
Sie können sehen, welche Kontextbearbeitungen auf Ihre Anfrage angewendet wurden, indem Sie dascontext_management-Antwortfeld verwenden, zusammen mit hilfreichen Statistiken über den gelöschten Inhalt und die Input-Token.
Response
message_delta-Event enthalten sein:
Streaming Response
Token-Zählung
Der Token-Zählungs-Endpunkt unterstützt Kontextverwaltung und ermöglicht es Ihnen, eine Vorschau darauf zu erhalten, wie viele Token Ihr Prompt nach der Anwendung der Kontextbearbeitung verwenden wird.Response
input_tokens) als auch die ursprüngliche Token-Anzahl vor dem Löschen (original_input_tokens).
Verwendung mit dem Memory Tool
Die Kontextbearbeitung kann mit dem Memory Tool kombiniert werden. Wenn Ihr Gesprächskontext sich dem konfigurierten Löschschwellenwert nähert, erhält Claude eine automatische Warnung, wichtige Informationen zu bewahren. Dies ermöglicht es Claude, Tool-Ergebnisse oder Kontext in seinen Memory-Dateien zu speichern, bevor sie aus der Gesprächshistorie gelöscht werden. Diese Kombination ermöglicht es Ihnen:- Wichtigen Kontext bewahren: Claude kann wesentliche Informationen aus Tool-Ergebnissen in Memory-Dateien schreiben, bevor diese Ergebnisse gelöscht werden
- Langanhaltende Workflows aufrechterhalten: Ermöglichen Sie agentische Workflows, die andernfalls die Kontextgrenzen überschreiten würden, indem Informationen in persistenten Speicher ausgelagert werden
- Informationen bei Bedarf abrufen: Claude kann zuvor gelöschte Informationen aus Memory-Dateien nachschlagen, wenn sie benötigt werden, anstatt alles im aktiven Kontextfenster zu behalten