Uso de ferramentas com eficiência de tokens
Claude Sonnet 3.7 é capaz de chamar ferramentas de maneira eficiente em tokens. As solicitações economizam em média 14% em tokens de saída, até 70%, o que também reduz a latência. A redução exata de tokens e melhorias de latência dependem da forma e tamanho geral da resposta.
O uso de ferramentas com eficiência de tokens é um recurso beta. Certifique-se de avaliar suas respostas antes de usá-lo em produção.
Use este formulário para fornecer feedback sobre a qualidade das respostas do modelo, a própria API ou a qualidade da documentação—mal podemos esperar para ouvir de você!
Se você escolher experimentar este recurso, recomendamos usar o Prompt Improver no Console para melhorar seu prompt.
O uso de ferramentas com eficiência de tokens atualmente não funciona com disable_parallel_tool_use
.
Os modelos Claude 4 (Opus 4.1, Opus 4 e Sonnet 4) não suportam este recurso. O cabeçalho beta token-efficient-tools-2025-02-19
não quebrará uma solicitação de API, mas resultará em uma operação sem efeito.
Para usar este recurso beta, simplesmente adicione o cabeçalho beta token-efficient-tools-2025-02-19
a uma solicitação de uso de ferramenta. Se você estiver usando o SDK, certifique-se de estar usando o SDK beta com anthropic.beta.messages
.
Aqui está um exemplo de como usar ferramentas eficientes em tokens com a API:
A solicitação acima deve, em média, usar menos tokens de entrada e saída do que uma solicitação normal. Para confirmar isso, tente fazer a mesma solicitação, mas remova token-efficient-tools-2025-02-19
da lista de cabeçalhos beta.
Para manter os benefícios do cache de prompt, use o cabeçalho beta consistentemente para solicitações que você gostaria de armazenar em cache. Se você usá-lo seletivamente, o cache de prompt falhará.