工具
高效令牌工具使用
了解如何使用Claude Sonnet 3.7的高效令牌工具使用功能来减少令牌消耗和延迟。
Claude Sonnet 3.7能够以高效令牌的方式调用工具。请求平均节省14%的输出令牌,最高可达70%,这也减少了延迟。确切的令牌减少和延迟改善取决于整体响应的形状和大小。
高效令牌工具使用是一个测试版功能。请确保在生产环境中使用之前评估您的响应。
请使用此表单提供关于模型响应质量、API本身或文档质量的反馈——我们迫不及待想听到您的意见!
高效令牌工具使用目前不支持disable_parallel_tool_use
。
Claude 4模型(Opus 4.1、Opus 4和Sonnet 4)不支持此功能。测试版头部token-efficient-tools-2025-02-19
不会中断API请求,但会导致无操作。
要使用此测试版功能,只需在工具使用请求中添加测试版头部token-efficient-tools-2025-02-19
。如果您使用SDK,请确保使用带有anthropic.beta.messages
的测试版SDK。
以下是如何使用API进行高效令牌工具的示例:
上述请求平均应该比正常请求使用更少的输入和输出令牌。要确认这一点,请尝试发出相同的请求,但从测试版头部列表中删除token-efficient-tools-2025-02-19
。
为了保持提示缓存的好处,请对您想要缓存的请求一致地使用测试版头部。如果您有选择性地使用它,提示缓存将失败。