Kontextbearbeitung

Die Kontextbearbeitung befindet sich derzeit in der Beta-Phase mit Unterstützung für das Löschen von Tool-Ergebnissen. Um sie zu aktivieren, verwenden Sie den Beta-Header context-management-2025-06-27 in Ihren API-Anfragen. Zusätzliche Kontextbearbeitungsstrategien werden in zukünftigen Versionen hinzugefügt.Bitte wenden Sie sich über unser Feedback-Formular an uns, um Ihr Feedback zu dieser Funktion zu teilen.

Wie es funktioniert

Die clear_tool_uses_20250919-Strategie löscht Tool-Ergebnisse, wenn der Gesprächskontext über Ihren konfigurierten Schwellenwert hinauswächst. Wenn aktiviert, löscht die API automatisch die ältesten Tool-Ergebnisse in chronologischer Reihenfolge und ersetzt sie durch Platzhaltertext, um Claude mitzuteilen, dass das Tool-Ergebnis entfernt wurde. Standardmäßig werden nur Tool-Ergebnisse gelöscht. Sie können optional sowohl Tool-Ergebnisse als auch Tool-Aufrufe (die Tool-Verwendungsparameter) löschen, indem Sie clear_tool_inputs auf true setzen.

Kontextbearbeitung erfolgt serverseitigDie Kontextbearbeitung wird serverseitig angewendet, bevor der Prompt Claude erreicht. Ihre Client-Anwendung behält die vollständige, unveränderte Gesprächshistorie bei – Sie müssen Ihren Client-Status nicht mit der bearbeiteten Version synchronisieren. Verwalten Sie weiterhin Ihre vollständige Gesprächshistorie lokal wie gewohnt.

Kontextbearbeitung und Prompt-CachingDie Kontextbearbeitung macht gecachte Prompt-Präfixe ungültig, da das Löschen von Inhalten die Prompt-Struktur verändert und die Übereinstimmungsanforderung für Cache-Treffer bricht. Um dies zu berücksichtigen, empfehlen wir, genügend Token zu löschen, um die Cache-Invalidierung lohnenswert zu machen. Verwenden Sie den clear_at_least-Parameter, um sicherzustellen, dass jedes Mal eine Mindestanzahl von Token gelöscht wird. Bei der Verwendung von Prompt-Caching mit Kontextbearbeitung entstehen Ihnen Cache-Schreibkosten jedes Mal, wenn Inhalte gelöscht werden, aber nachfolgende Anfragen können den neu gecachten Präfix wiederverwenden.

Unterstützte Modelle

Die Kontextbearbeitung ist verfügbar für:

Claude Opus 4.1 (claude-opus-4-1-20250805)
Claude Opus 4 (claude-opus-4-20250514)
Claude Sonnet 4.5 (claude-sonnet-4-5-20250929)
Claude Sonnet 4 (claude-sonnet-4-20250514)

Grundlegende Verwendung

Der einfachste Weg, die Kontextbearbeitung zu aktivieren, ist nur den Strategietyp anzugeben, da alle anderen Konfigurationsoptionen ihre Standardwerte verwenden:

curl https://api.anthropic.com/v1/messages \
    --header "x-api-key: $ANTHROPIC_API_KEY" \
    --header "anthropic-version: 2023-06-01" \
    --header "content-type: application/json" \
    --header "anthropic-beta: context-management-2025-06-27" \
    --data '{
        "model": "claude-sonnet-4-5",
        "max_tokens": 4096,
        "messages": [
            {
                "role": "user",
                "content": "Suche nach aktuellen Entwicklungen in der KI"
            }
        ],
        "tools": [
            {
                "type": "web_search_20250305",
                "name": "web_search"
            }
        ],
        "context_management": {
            "edits": [
                {"type": "clear_tool_uses_20250919"}
            ]
        }
    }'

Erweiterte Konfiguration

Sie können das Verhalten der Kontextbearbeitung mit zusätzlichen Parametern anpassen:

curl https://api.anthropic.com/v1/messages \
    --header "x-api-key: $ANTHROPIC_API_KEY" \
    --header "anthropic-version: 2023-06-01" \
    --header "content-type: application/json" \
    --header "anthropic-beta: context-management-2025-06-27" \
    --data '{
        "model": "claude-sonnet-4-5",
        "max_tokens": 4096,
        "messages": [
            {
                "role": "user",
                "content": "Erstelle eine einfache Kommandozeilen-Taschenrechner-App mit Python"
            }
        ],
        "tools": [
            {
                "type": "text_editor_20250728",
                "name": "str_replace_based_edit_tool",
                "max_characters": 10000
            },
            {
                "type": "web_search_20250305",
                "name": "web_search",
                "max_uses": 3
            }
        ],
        "context_management": {
            "edits": [
                {
                    "type": "clear_tool_uses_20250919",
                    "trigger": {
                        "type": "input_tokens",
                        "value": 30000
                    },
                    "keep": {
                        "type": "tool_uses",
                        "value": 3
                    },
                    "clear_at_least": {
                        "type": "input_tokens",
                        "value": 5000
                    },
                    "exclude_tools": ["web_search"]
                }
            ]
        }
    }'

Konfigurationsoptionen

Konfigurationsoption	Standard	Beschreibung
`trigger`	100.000 Input-Token	Definiert, wann die Kontextbearbeitungsstrategie aktiviert wird. Sobald der Prompt diesen Schwellenwert überschreitet, beginnt das Löschen. Sie können diesen Wert entweder in `input_tokens` oder `tool_uses` angeben.
`keep`	3 Tool-Verwendungen	Definiert, wie viele aktuelle Tool-Verwendungs-/Ergebnispaare nach dem Löschen behalten werden sollen. Die API entfernt zuerst die ältesten Tool-Interaktionen und bewahrt die neuesten auf.
`clear_at_least`	Keine	Stellt sicher, dass jedes Mal eine Mindestanzahl von Token gelöscht wird, wenn die Strategie aktiviert wird. Wenn die API nicht mindestens die angegebene Menge löschen kann, wird die Strategie nicht angewendet. Dies hilft zu bestimmen, ob das Löschen des Kontexts es wert ist, Ihren Prompt-Cache zu brechen.
`exclude_tools`	Keine	Liste von Tool-Namen, deren Tool-Verwendungen und -Ergebnisse niemals gelöscht werden sollen. Nützlich für die Bewahrung wichtiger Kontexte.
`clear_tool_inputs`	`false`	Steuert, ob die Tool-Aufrufparameter zusammen mit den Tool-Ergebnissen gelöscht werden. Standardmäßig werden nur die Tool-Ergebnisse gelöscht, während Claudes ursprüngliche Tool-Aufrufe sichtbar bleiben.

Antwortformat

Sie können sehen, welche Kontextbearbeitungen auf Ihre Anfrage angewendet wurden, indem Sie das context_management-Antwortfeld verwenden, zusammen mit hilfreichen Statistiken über den gelöschten Inhalt und die Input-Token.

Response

{
    "id": "msg_013Zva2CMHLNnXjNJJKqJ2EF",
    "type": "message",
    "role": "assistant",
    "content": [...],
    "usage": {...},
    "context_management": {
        "applied_edits": [
            {
                "type": "clear_tool_uses_20250919",
                "cleared_tool_uses": 8,
                "cleared_input_tokens": 50000
            }
        ]
    }
}

Für Streaming-Antworten werden die Kontextbearbeitungen im finalen message_delta-Event enthalten sein:

Streaming Response

{
    "type": "message_delta",
    "delta": {
        "stop_reason": "end_turn",
        "stop_sequence": null
    },
    "usage": {
        "output_tokens": 1024
    },
    "context_management": {
        "applied_edits": [...]
    }
}

Token-Zählung

Der Token-Zählungs-Endpunkt unterstützt Kontextverwaltung und ermöglicht es Ihnen, eine Vorschau darauf zu erhalten, wie viele Token Ihr Prompt nach der Anwendung der Kontextbearbeitung verwenden wird.

curl https://api.anthropic.com/v1/messages/count_tokens \
    --header "x-api-key: $ANTHROPIC_API_KEY" \
    --header "anthropic-version: 2023-06-01" \
    --header "content-type: application/json" \
    --header "anthropic-beta: context-management-2025-06-27" \
    --data '{
        "model": "claude-sonnet-4-5",
        "messages": [
            {
                "role": "user",
                "content": "Setze unser Gespräch fort..."
            }
        ],
        "tools": [...],
        "context_management": {
            "edits": [
                {
                    "type": "clear_tool_uses_20250919",
                    "trigger": {
                        "type": "input_tokens",
                        "value": 30000
                    },
                    "keep": {
                        "type": "tool_uses",
                        "value": 5
                    }
                }
            ]
        }
    }'

Response

{
    "input_tokens": 25000,
    "context_management": {
        "original_input_tokens": 70000
    }
}

Die Antwort zeigt sowohl die finale Token-Anzahl nach der Anwendung der Kontextverwaltung (input_tokens) als auch die ursprüngliche Token-Anzahl vor dem Löschen (original_input_tokens).

Verwendung mit dem Memory Tool

Die Kontextbearbeitung kann mit dem Memory Tool kombiniert werden. Wenn Ihr Gesprächskontext sich dem konfigurierten Löschschwellenwert nähert, erhält Claude eine automatische Warnung, wichtige Informationen zu bewahren. Dies ermöglicht es Claude, Tool-Ergebnisse oder Kontext in seinen Memory-Dateien zu speichern, bevor sie aus der Gesprächshistorie gelöscht werden. Diese Kombination ermöglicht es Ihnen:

Wichtigen Kontext bewahren: Claude kann wesentliche Informationen aus Tool-Ergebnissen in Memory-Dateien schreiben, bevor diese Ergebnisse gelöscht werden
Langanhaltende Workflows aufrechterhalten: Ermöglichen Sie agentische Workflows, die andernfalls die Kontextgrenzen überschreiten würden, indem Informationen in persistenten Speicher ausgelagert werden
Informationen bei Bedarf abrufen: Claude kann zuvor gelöschte Informationen aus Memory-Dateien nachschlagen, wenn sie benötigt werden, anstatt alles im aktiven Kontextfenster zu behalten

Zum Beispiel kann Claude in einem Dateibearbeitungs-Workflow, bei dem Claude viele Operationen durchführt, abgeschlossene Änderungen in Memory-Dateien zusammenfassen, während der Kontext wächst. Wenn Tool-Ergebnisse gelöscht werden, behält Claude über sein Memory-System Zugang zu diesen Informationen und kann effektiv weiterarbeiten. Um beide Funktionen zusammen zu verwenden, aktivieren Sie sie in Ihrer API-Anfrage:

response = client.beta.messages.create(
    model="claude-sonnet-4-5",
    max_tokens=4096,
    messages=[...],
    tools=[
        {
            "type": "memory_20250818",
            "name": "memory"
        },
        # Ihre anderen Tools
    ],
    betas=["context-management-2025-06-27"],
    context_management={
        "edits": [
            {"type": "clear_tool_uses_20250919"}
        ]
    }
)

Erste Schritte

Modelle & Preise

Mit Claude entwickeln

Funktionen

Werkzeuge

Agent-Fähigkeiten

Agent SDK

MCP in der API

Claude auf Drittanbieter-Plattformen

Prompt-Engineering

Testen & bewerten

Schutzmaßnahmen verstärken

Verwaltung und Überwachung

Wie es funktioniert

Unterstützte Modelle

Grundlegende Verwendung

Erweiterte Konfiguration

Konfigurationsoptionen

Antwortformat

Token-Zählung

Verwendung mit dem Memory Tool

Erste Schritte

Modelle & Preise

Mit Claude entwickeln

Funktionen

Werkzeuge

Agent-Fähigkeiten

Agent SDK

MCP in der API

Claude auf Drittanbieter-Plattformen

Prompt-Engineering

Testen & bewerten

Schutzmaßnahmen verstärken

Verwaltung und Überwachung

​Wie es funktioniert

​Unterstützte Modelle

​Grundlegende Verwendung

​Erweiterte Konfiguration

​Konfigurationsoptionen

​Antwortformat

​Token-Zählung

​Verwendung mit dem Memory Tool

Wie es funktioniert

Unterstützte Modelle

Grundlegende Verwendung

Erweiterte Konfiguration

Konfigurationsoptionen

Antwortformat

Token-Zählung

Verwendung mit dem Memory Tool