A partire da Claude Sonnet 3.7, Claude è in grado di chiamare gli strumenti in modo efficiente dal punto di vista dei token. Le richieste risparmiano in media il 14% nei token di output, fino al 70%, il che riduce anche la latenza. La riduzione esatta dei token e i miglioramenti della latenza dipendono dalla forma e dalle dimensioni complessive della risposta.
L’uso efficiente dei token per gli strumenti è una funzionalità beta in Claude 3.7. Per utilizzare questa funzionalità beta, aggiungi semplicemente l’header beta token-efficient-tools-2025-02-19 a una richiesta di uso degli strumenti.Tutti i modelli Claude 4 supportano l’uso efficiente dei token per gli strumenti per impostazione predefinita. Non è necessario alcun header beta, ma l’header token-efficient-tools-2025-02-19 non interromperà una richiesta API.
L’uso efficiente dei token per gli strumenti attualmente non funziona con disable_parallel_tool_use.
Ecco un esempio di come utilizzare gli strumenti efficienti per i token con l’API in Claude Sonnet 3.7:
curl https://api.anthropic.com/v1/messages \
  -H "content-type: application/json" \
  -H "x-api-key: $ANTHROPIC_API_KEY" \
  -H "anthropic-version: 2023-06-01" \
  -H "anthropic-beta: token-efficient-tools-2025-02-19" \
  -d '{
    "model": "claude-3-7-sonnet-20250219",
    "max_tokens": 1024,
    "tools": [
      {
        "name": "get_weather",
        "description": "Get the current weather in a given location",
        "input_schema": {
          "type": "object",
          "properties": {
            "location": {
              "type": "string",
              "description": "The city and state, e.g. San Francisco, CA"
            }
          },
          "required": [
            "location"
          ]
        }
      }
    ],
    "messages": [
      {
        "role": "user",
        "content": "Tell me the weather in San Francisco."
      }
    ]
  }' | jq '.usage'
La richiesta sopra dovrebbe, in media, utilizzare meno token di input e output rispetto a una richiesta normale. Per confermarlo, prova a fare la stessa richiesta ma rimuovi token-efficient-tools-2025-02-19 dall’elenco degli header beta.
Per mantenere i vantaggi del prompt caching, usa l’header beta in modo coerente per le richieste che vorresti memorizzare nella cache. Se lo usi selettivamente, il prompt caching fallirà.