À partir de Claude Sonnet 3.7, Claude est capable d’appeler des outils de manière efficace en tokens. Les requêtes économisent en moyenne 14% de tokens de sortie, jusqu’à 70%, ce qui réduit également la latence. La réduction exacte des tokens et les améliorations de latence dépendent de la forme et de la taille globales de la réponse.
L’utilisation d’outils efficace en tokens est une fonctionnalité bêta dans Claude 3.7. Pour utiliser cette fonctionnalité bêta, ajoutez simplement l’en-tête bêta token-efficient-tools-2025-02-19 à une requête d’utilisation d’outils.Tous les modèles Claude 4 prennent en charge l’utilisation d’outils efficace en tokens par défaut. Aucun en-tête bêta n’est nécessaire, mais l’en-tête token-efficient-tools-2025-02-19 ne cassera pas une requête API.
L’utilisation d’outils efficace en tokens ne fonctionne actuellement pas avec disable_parallel_tool_use.
Voici un exemple de comment utiliser les outils efficaces en tokens avec l’API dans Claude Sonnet 3.7 :
curl https://api.anthropic.com/v1/messages \
  -H "content-type: application/json" \
  -H "x-api-key: $ANTHROPIC_API_KEY" \
  -H "anthropic-version: 2023-06-01" \
  -H "anthropic-beta: token-efficient-tools-2025-02-19" \
  -d '{
    "model": "claude-3-7-sonnet-20250219",
    "max_tokens": 1024,
    "tools": [
      {
        "name": "get_weather",
        "description": "Get the current weather in a given location",
        "input_schema": {
          "type": "object",
          "properties": {
            "location": {
              "type": "string",
              "description": "The city and state, e.g. San Francisco, CA"
            }
          },
          "required": [
            "location"
          ]
        }
      }
    ],
    "messages": [
      {
        "role": "user",
        "content": "Tell me the weather in San Francisco."
      }
    ]
  }' | jq '.usage'
La requête ci-dessus devrait, en moyenne, utiliser moins de tokens d’entrée et de sortie qu’une requête normale. Pour confirmer cela, essayez de faire la même requête mais supprimez token-efficient-tools-2025-02-19 de la liste des en-têtes bêta.
Pour conserver les avantages de la mise en cache des prompts, utilisez l’en-tête bêta de manière cohérente pour les requêtes que vous souhaitez mettre en cache. Si vous l’utilisez de manière sélective, la mise en cache des prompts échouera.