Claude Sonnet 3.7は、トークン効率的な方法でツールを呼び出すことができます。リクエストは出力トークンを平均14%、最大70%節約し、レイテンシも削減します。正確なトークン削減とレイテンシの改善は、全体的なレスポンスの形状とサイズによって異なります。

トークン効率的なツール使用はベータ機能です。本番環境で使用する前に、必ずレスポンスを評価してください。

モデルレスポンスの品質、API自体、またはドキュメントの品質についてフィードバックを提供するには、このフォームをご利用ください。皆様からのご意見をお待ちしております!

この機能を試してみる場合は、ConsolePrompt Improverを使用してプロンプトを改善することをお勧めします。

トークン効率的なツール使用は現在、disable_parallel_tool_useでは動作しません。

Claude 4モデル(Opus 4.1、Opus 4、Sonnet 4)はこの機能をサポートしていません。ベータヘッダーtoken-efficient-tools-2025-02-19はAPIリクエストを破綻させませんが、何も実行されません。

このベータ機能を使用するには、ツール使用リクエストにベータヘッダーtoken-efficient-tools-2025-02-19を追加するだけです。SDKを使用している場合は、anthropic.beta.messagesでベータSDKを使用していることを確認してください。

以下は、APIでトークン効率的なツールを使用する方法の例です:

curl https://api.anthropic.com/v1/messages \
  -H "content-type: application/json" \
  -H "x-api-key: $ANTHROPIC_API_KEY" \
  -H "anthropic-version: 2023-06-01" \
  -H "anthropic-beta: token-efficient-tools-2025-02-19" \
  -d '{
    "model": "claude-3-7-sonnet-20250219",
    "max_tokens": 1024,
    "tools": [
      {
        "name": "get_weather",
        "description": "Get the current weather in a given location",
        "input_schema": {
          "type": "object",
          "properties": {
            "location": {
              "type": "string",
              "description": "The city and state, e.g. San Francisco, CA"
            }
          },
          "required": [
            "location"
          ]
        }
      }
    ],
    "messages": [
      {
        "role": "user",
        "content": "Tell me the weather in San Francisco."
      }
    ]
  }' | jq '.usage'

上記のリクエストは、平均的に通常のリクエストよりも少ない入力および出力トークンを使用するはずです。これを確認するには、同じリクエストを作成しますが、ベータヘッダーリストからtoken-efficient-tools-2025-02-19を削除してみてください。

プロンプトキャッシュの利点を維持するには、キャッシュしたいリクエストに対して一貫してベータヘッダーを使用してください。選択的に使用すると、プロンプトキャッシュが失敗します。