L’édition de contexte est actuellement en version bêta avec prise en charge de l’effacement des résultats d’outils. Pour l’activer, utilisez l’en-tête bêta context-management-2025-06-27 dans vos requêtes API. Des stratégies d’édition de contexte supplémentaires seront ajoutées dans les versions futures.Veuillez nous contacter via notre formulaire de commentaires pour partager vos commentaires sur cette fonctionnalité.

Comment ça fonctionne

La stratégie clear_tool_uses_20250919 efface les résultats d’outils lorsque le contexte de conversation dépasse votre seuil configuré. Lorsqu’elle est activée, l’API efface automatiquement les résultats d’outils les plus anciens dans l’ordre chronologique, en les remplaçant par du texte de substitution pour faire savoir à Claude que le résultat de l’outil a été supprimé. Par défaut, seuls les résultats d’outils sont effacés. Vous pouvez optionnellement effacer à la fois les résultats d’outils et les appels d’outils (les paramètres d’utilisation d’outils) en définissant clear_tool_inputs sur true. L’édition de contexte invalide les préfixes d’invite mis en cache car l’effacement de contenu modifie la structure de l’invite, brisant l’exigence de correspondance pour les succès de cache. Pour tenir compte de cela, nous recommandons d’effacer suffisamment de jetons pour que l’invalidation du cache en vaille la peine. Utilisez le paramètre clear_at_least pour garantir qu’un nombre minimum de jetons est effacé à chaque fois. Lors de l’utilisation de la mise en cache d’invite avec l’édition de contexte, vous encourrez des coûts d’écriture de cache chaque fois que le contenu est effacé, mais les requêtes suivantes peuvent réutiliser le préfixe nouvellement mis en cache.

Modèles pris en charge

L’édition de contexte est disponible sur :
  • Claude Opus 4.1 (claude-opus-4-1-20250805)
  • Claude Opus 4 (claude-opus-4-20250514)
  • Claude Sonnet 4.5 (claude-sonnet-4-5-20250929)
  • Claude Sonnet 4 (claude-sonnet-4-20250514)

Utilisation de base

La façon la plus simple d’activer l’édition de contexte est de spécifier uniquement le type de stratégie, car toutes les autres options de configuration utiliseront leurs valeurs par défaut :
curl https://api.anthropic.com/v1/messages \
    --header "x-api-key: $ANTHROPIC_API_KEY" \
    --header "anthropic-version: 2023-06-01" \
    --header "content-type: application/json" \
    --header "anthropic-beta: context-management-2025-06-27" \
    --data '{
        "model": "claude-sonnet-4-5",
        "max_tokens": 4096,
        "messages": [
            {
                "role": "user",
                "content": "Recherchez les développements récents en IA"
            }
        ],
        "tools": [
            {
                "type": "web_search_20250305",
                "name": "web_search"
            }
        ],
        "context_management": {
            "edits": [
                {"type": "clear_tool_uses_20250919"}
            ]
        }
    }'

Configuration avancée

Vous pouvez personnaliser le comportement d’édition de contexte avec des paramètres supplémentaires :
curl https://api.anthropic.com/v1/messages \
    --header "x-api-key: $ANTHROPIC_API_KEY" \
    --header "anthropic-version: 2023-06-01" \
    --header "content-type: application/json" \
    --header "anthropic-beta: context-management-2025-06-27" \
    --data '{
        "model": "claude-sonnet-4-5",
        "max_tokens": 4096,
        "messages": [
            {
                "role": "user",
                "content": "Créez une application calculatrice en ligne de commande simple utilisant Python"
            }
        ],
        "tools": [
            {
                "type": "text_editor_20250728",
                "name": "str_replace_based_edit_tool",
                "max_characters": 10000
            },
            {
                "type": "web_search_20250305",
                "name": "web_search",
                "max_uses": 3
            }
        ],
        "context_management": {
            "edits": [
                {
                    "type": "clear_tool_uses_20250919",
                    "trigger": {
                        "type": "input_tokens",
                        "value": 30000
                    },
                    "keep": {
                        "type": "tool_uses",
                        "value": 3
                    },
                    "clear_at_least": {
                        "type": "input_tokens",
                        "value": 5000
                    },
                    "exclude_tools": ["web_search"]
                }
            ]
        }
    }'

Options de configuration

Option de configurationPar défautDescription
trigger100 000 jetons d’entréeDéfinit quand la stratégie d’édition de contexte s’active. Une fois que l’invite dépasse ce seuil, l’effacement commencera. Vous pouvez spécifier cette valeur en input_tokens ou tool_uses.
keep3 utilisations d’outilsDéfinit combien de paires récentes d’utilisation/résultat d’outils conserver après l’effacement. L’API supprime d’abord les interactions d’outils les plus anciennes, préservant les plus récentes.
clear_at_leastAucunGarantit qu’un nombre minimum de jetons est effacé chaque fois que la stratégie s’active. Si l’API ne peut pas effacer au moins le montant spécifié, la stratégie ne sera pas appliquée. Cela aide à déterminer si l’effacement de contexte vaut la peine de casser votre cache d’invite.
exclude_toolsAucunListe des noms d’outils dont les utilisations et résultats d’outils ne doivent jamais être effacés. Utile pour préserver un contexte important.
clear_tool_inputsfalseContrôle si les paramètres d’appel d’outils sont effacés avec les résultats d’outils. Par défaut, seuls les résultats d’outils sont effacés tout en gardant visibles les appels d’outils originaux de Claude.

Format de réponse

Vous pouvez voir quelles éditions de contexte ont été appliquées à votre requête en utilisant le champ de réponse context_management, ainsi que des statistiques utiles sur le contenu et les jetons d’entrée effacés.
Response
{
    "id": "msg_013Zva2CMHLNnXjNJJKqJ2EF",
    "type": "message",
    "role": "assistant",
    "content": [...],
    "usage": {...},
    "context_management": {
        "applied_edits": [
            {
                "type": "clear_tool_uses_20250919",
                "cleared_tool_uses": 8,
                "cleared_input_tokens": 50000
            }
        ]
    }
}
Pour les réponses en streaming, les éditions de contexte seront incluses dans l’événement message_delta final :
Streaming Response
{
    "type": "message_delta",
    "delta": {
        "stop_reason": "end_turn",
        "stop_sequence": null
    },
    "usage": {
        "output_tokens": 1024
    },
    "context_management": {
        "applied_edits": [...]
    }
}

Comptage de jetons

Le point de terminaison /v1/messages/count_tokens prend en charge la gestion de contexte, vous permettant de prévisualiser combien de jetons votre invite utilisera après l’application de l’édition de contexte.
curl https://api.anthropic.com/v1/messages/count_tokens \
    --header "x-api-key: $ANTHROPIC_API_KEY" \
    --header "anthropic-version: 2023-06-01" \
    --header "content-type: application/json" \
    --header "anthropic-beta: context-management-2025-06-27" \
    --data '{
        "model": "claude-sonnet-4-5",
        "messages": [
            {
                "role": "user",
                "content": "Continuez notre conversation..."
            }
        ],
        "tools": [...],
        "context_management": {
            "edits": [
                {
                    "type": "clear_tool_uses_20250919",
                    "trigger": {
                        "type": "input_tokens",
                        "value": 30000
                    },
                    "keep": {
                        "type": "tool_uses",
                        "value": 5
                    }
                }
            ]
        }
    }'
Response
{
    "input_tokens": 25000,
    "context_management": {
        "original_input_tokens": 70000
    }
}
La réponse montre à la fois le nombre final de jetons après l’application de la gestion de contexte (input_tokens) et le nombre original de jetons avant tout effacement (original_input_tokens).