A partir do Claude Sonnet 3.7, Claude é capaz de chamar ferramentas de forma eficiente em tokens. As solicitações economizam em média 14% em tokens de saída, até 70%, o que também reduz a latência. A redução exata de tokens e melhorias de latência dependem da forma e tamanho geral da resposta.
O uso eficiente de tokens para ferramentas é um recurso beta no Claude 3.7. Para usar este recurso beta, simplesmente adicione o cabeçalho beta token-efficient-tools-2025-02-19 a uma solicitação de uso de ferramenta.Todos os modelos Claude 4 suportam uso eficiente de tokens para ferramentas por padrão. Nenhum cabeçalho beta é necessário, mas o cabeçalho token-efficient-tools-2025-02-19 não quebrará uma solicitação de API.
O uso eficiente de tokens para ferramentas atualmente não funciona com disable_parallel_tool_use.
Aqui está um exemplo de como usar ferramentas eficientes em tokens com a API no Claude Sonnet 3.7:
curl https://api.anthropic.com/v1/messages \
  -H "content-type: application/json" \
  -H "x-api-key: $ANTHROPIC_API_KEY" \
  -H "anthropic-version: 2023-06-01" \
  -H "anthropic-beta: token-efficient-tools-2025-02-19" \
  -d '{
    "model": "claude-3-7-sonnet-20250219",
    "max_tokens": 1024,
    "tools": [
      {
        "name": "get_weather",
        "description": "Get the current weather in a given location",
        "input_schema": {
          "type": "object",
          "properties": {
            "location": {
              "type": "string",
              "description": "The city and state, e.g. San Francisco, CA"
            }
          },
          "required": [
            "location"
          ]
        }
      }
    ],
    "messages": [
      {
        "role": "user",
        "content": "Tell me the weather in San Francisco."
      }
    ]
  }' | jq '.usage'
A solicitação acima deve, em média, usar menos tokens de entrada e saída do que uma solicitação normal. Para confirmar isso, tente fazer a mesma solicitação mas remova token-efficient-tools-2025-02-19 da lista de cabeçalhos beta.
Para manter os benefícios do cache de prompt, use o cabeçalho beta consistentemente para solicitações que você gostaria de cachear. Se você usá-lo seletivamente, o cache de prompt falhará.