トークン効率的なツール使用
Claude Sonnet 3.7は、トークン効率的な方法でツールを呼び出すことができます。リクエストは出力トークンを平均14%、最大70%節約し、レイテンシも削減します。正確なトークン削減とレイテンシの改善は、全体的なレスポンスの形状とサイズによって異なります。
トークン効率的なツール使用はベータ機能です。本番環境で使用する前に、必ずレスポンスを評価してください。
モデルレスポンスの品質、API自体、またはドキュメントの品質についてフィードバックを提供するには、このフォームをご利用ください。皆様からのご意見をお待ちしております!
この機能を試してみる場合は、ConsoleのPrompt Improverを使用してプロンプトを改善することをお勧めします。
トークン効率的なツール使用は現在、disable_parallel_tool_use
では動作しません。
Claude 4モデル(Opus 4.1、Opus 4、Sonnet 4)はこの機能をサポートしていません。ベータヘッダーtoken-efficient-tools-2025-02-19
はAPIリクエストを破綻させませんが、何も実行されません。
このベータ機能を使用するには、ツール使用リクエストにベータヘッダーtoken-efficient-tools-2025-02-19
を追加するだけです。SDKを使用している場合は、anthropic.beta.messages
でベータSDKを使用していることを確認してください。
以下は、APIでトークン効率的なツールを使用する方法の例です:
上記のリクエストは、平均的に通常のリクエストよりも少ない入力および出力トークンを使用するはずです。これを確認するには、同じリクエストを作成しますが、ベータヘッダーリストからtoken-efficient-tools-2025-02-19
を削除してみてください。
プロンプトキャッシュの利点を維持するには、キャッシュしたいリクエストに対して一貫してベータヘッダーを使用してください。選択的に使用すると、プロンプトキャッシュが失敗します。