Utilisation d'outils efficace en tokens

À partir de Claude Sonnet 3.7, Claude est capable d’appeler des outils de manière efficace en tokens. Les requêtes économisent en moyenne 14% de tokens de sortie, jusqu’à 70%, ce qui réduit également la latence. La réduction exacte des tokens et les améliorations de latence dépendent de la forme et de la taille globales de la réponse.

L’utilisation d’outils efficace en tokens est une fonctionnalité bêta dans Claude 3.7. Pour utiliser cette fonctionnalité bêta, ajoutez simplement l’en-tête bêta token-efficient-tools-2025-02-19 à une requête d’utilisation d’outils.Tous les modèles Claude 4 prennent en charge l’utilisation d’outils efficace en tokens par défaut. Aucun en-tête bêta n’est nécessaire, mais l’en-tête token-efficient-tools-2025-02-19 ne cassera pas une requête API.

L’utilisation d’outils efficace en tokens ne fonctionne actuellement pas avec disable_parallel_tool_use.

Voici un exemple de comment utiliser les outils efficaces en tokens avec l’API dans Claude Sonnet 3.7 :

curl https://api.anthropic.com/v1/messages \
  -H "content-type: application/json" \
  -H "x-api-key: $ANTHROPIC_API_KEY" \
  -H "anthropic-version: 2023-06-01" \
  -H "anthropic-beta: token-efficient-tools-2025-02-19" \
  -d '{
    "model": "claude-3-7-sonnet-20250219",
    "max_tokens": 1024,
    "tools": [
      {
        "name": "get_weather",
        "description": "Get the current weather in a given location",
        "input_schema": {
          "type": "object",
          "properties": {
            "location": {
              "type": "string",
              "description": "The city and state, e.g. San Francisco, CA"
            }
          },
          "required": [
            "location"
          ]
        }
      }
    ],
    "messages": [
      {
        "role": "user",
        "content": "Tell me the weather in San Francisco."
      }
    ]
  }' | jq '.usage'

La requête ci-dessus devrait, en moyenne, utiliser moins de tokens d’entrée et de sortie qu’une requête normale. Pour confirmer cela, essayez de faire la même requête mais supprimez token-efficient-tools-2025-02-19 de la liste des en-têtes bêta.

Pour conserver les avantages de la mise en cache des prompts, utilisez l’en-tête bêta de manière cohérente pour les requêtes que vous souhaitez mettre en cache. Si vous l’utilisez de manière sélective, la mise en cache des prompts échouera.

Comment implémenter l'utilisation d'outils Streaming d'outils à granularité fine

Premiers pas

Modèles et tarification

Créer avec Claude

Capacités

Outils

Compétences de l'Agent

SDK Agent

MCP dans l'API

Claude sur les plateformes tierces

Ingénierie des prompts

Tester et évaluer

Renforcer les garde-fous

Utilisation d'outils efficace en tokens