A edição de contexto está atualmente em beta com suporte para limpeza de resultados de ferramentas. Para habilitá-la, use o cabeçalho beta
context-management-2025-06-27
em suas solicitações de API. Estratégias adicionais de edição de contexto serão adicionadas em versões futuras.Entre em contato através do nosso formulário de feedback para compartilhar seu feedback sobre este recurso.Como funciona
A estratégiaclear_tool_uses_20250919
limpa resultados de ferramentas quando o contexto da conversa cresce além do seu limite configurado. Quando ativada, a API limpa automaticamente os resultados de ferramentas mais antigos em ordem cronológica, substituindo-os por texto de espaço reservado para informar ao Claude que o resultado da ferramenta foi removido. Por padrão, apenas os resultados de ferramentas são limpos. Você pode opcionalmente limpar tanto os resultados de ferramentas quanto as chamadas de ferramentas (os parâmetros de uso da ferramenta) definindo clear_tool_inputs
como true.
A edição de contexto invalida prefixos de prompt em cache porque limpar conteúdo modifica a estrutura do prompt, quebrando o requisito de correspondência para acertos de cache. Para levar isso em conta, recomendamos limpar tokens suficientes para tornar a invalidação do cache vantajosa. Use o parâmetro clear_at_least
para garantir que um número mínimo de tokens seja limpo a cada vez. Ao usar cache de prompt com edição de contexto, você incorrerá em custos de escrita de cache cada vez que o conteúdo for limpo, mas solicitações subsequentes podem reutilizar o prefixo recém-armazenado em cache.
Modelos suportados
A edição de contexto está disponível em:- Claude Opus 4.1 (
claude-opus-4-1-20250805
) - Claude Opus 4 (
claude-opus-4-20250514
) - Claude Sonnet 4.5 (
claude-sonnet-4-5-20250929
) - Claude Sonnet 4 (
claude-sonnet-4-20250514
)
Uso básico
A maneira mais simples de habilitar a edição de contexto é especificar apenas o tipo de estratégia, pois todas as outras opções de configuração usarão seus valores padrão:Configuração avançada
Você pode personalizar o comportamento da edição de contexto com parâmetros adicionais:Opções de configuração
Opção de configuração | Padrão | Descrição |
---|---|---|
trigger | 100.000 tokens de entrada | Define quando a estratégia de edição de contexto é ativada. Uma vez que o prompt exceda este limite, a limpeza começará. Você pode especificar este valor em input_tokens ou tool_uses . |
keep | 3 usos de ferramentas | Define quantos pares recentes de uso/resultado de ferramenta manter após a limpeza ocorrer. A API remove as interações de ferramentas mais antigas primeiro, preservando as mais recentes. |
clear_at_least | Nenhum | Garante que um número mínimo de tokens seja limpo cada vez que a estratégia é ativada. Se a API não conseguir limpar pelo menos a quantidade especificada, a estratégia não será aplicada. Isso ajuda a determinar se a limpeza de contexto vale a pena quebrar seu cache de prompt. |
exclude_tools | Nenhum | Lista de nomes de ferramentas cujos usos e resultados de ferramentas nunca devem ser limpos. Útil para preservar contexto importante. |
clear_tool_inputs | false | Controla se os parâmetros de chamada da ferramenta são limpos junto com os resultados da ferramenta. Por padrão, apenas os resultados da ferramenta são limpos enquanto mantém as chamadas de ferramenta originais do Claude visíveis. |
Formato de resposta
Você pode ver quais edições de contexto foram aplicadas à sua solicitação usando o campo de respostacontext_management
, junto com estatísticas úteis sobre o conteúdo e tokens de entrada limpos.
Response
message_delta
:
Streaming Response
Contagem de tokens
O endpoint /v1/messages/count_tokens suporta gerenciamento de contexto, permitindo que você visualize quantos tokens seu prompt usará após a edição de contexto ser aplicada.Response
input_tokens
) quanto a contagem original de tokens antes de qualquer limpeza ocorrer (original_input_tokens
).