A partir de Claude Sonnet 3.7, Claude es capaz de llamar herramientas de manera eficiente en tokens. Las solicitudes ahorran un promedio del 14% en tokens de salida, hasta un 70%, lo que también reduce la latencia. La reducción exacta de tokens y las mejoras de latencia dependen de la forma y el tamaño general de la respuesta.
El uso eficiente de herramientas con tokens es una característica beta en Claude 3.7. Para usar esta característica beta, simplemente agregue el encabezado beta token-efficient-tools-2025-02-19 a una solicitud de uso de herramientas.Todos los modelos Claude 4 admiten el uso eficiente de herramientas con tokens por defecto. No se necesita encabezado beta, pero el encabezado token-efficient-tools-2025-02-19 no romperá una solicitud de API.
El uso eficiente de herramientas con tokens actualmente no funciona con disable_parallel_tool_use.
Aquí hay un ejemplo de cómo usar herramientas eficientes en tokens con la API en Claude Sonnet 3.7:
curl https://api.anthropic.com/v1/messages \
  -H "content-type: application/json" \
  -H "x-api-key: $ANTHROPIC_API_KEY" \
  -H "anthropic-version: 2023-06-01" \
  -H "anthropic-beta: token-efficient-tools-2025-02-19" \
  -d '{
    "model": "claude-3-7-sonnet-20250219",
    "max_tokens": 1024,
    "tools": [
      {
        "name": "get_weather",
        "description": "Get the current weather in a given location",
        "input_schema": {
          "type": "object",
          "properties": {
            "location": {
              "type": "string",
              "description": "The city and state, e.g. San Francisco, CA"
            }
          },
          "required": [
            "location"
          ]
        }
      }
    ],
    "messages": [
      {
        "role": "user",
        "content": "Tell me the weather in San Francisco."
      }
    ]
  }' | jq '.usage'
La solicitud anterior debería, en promedio, usar menos tokens de entrada y salida que una solicitud normal. Para confirmar esto, intente hacer la misma solicitud pero elimine token-efficient-tools-2025-02-19 de la lista de encabezados beta.
Para mantener los beneficios del almacenamiento en caché de prompts, use el encabezado beta de manera consistente para las solicitudes que desee almacenar en caché. Si lo usa selectivamente, el almacenamiento en caché de prompts fallará.