Токен-эффективное использование инструментов
Claude Sonnet 3.7 способен вызывать инструменты токен-эффективным способом. Запросы экономят в среднем 14% выходных токенов, до 70%, что также снижает задержку. Точное сокращение токенов и улучшения задержки зависят от общей формы и размера ответа.
Токен-эффективное использование инструментов является бета-функцией. Пожалуйста, убедитесь, что вы оцениваете свои ответы перед использованием в продакшене.
Пожалуйста, используйте эту форму для предоставления обратной связи о качестве ответов модели, самом API или качестве документации — мы не можем дождаться, чтобы услышать от вас!
Если вы решите поэкспериментировать с этой функцией, мы рекомендуем использовать Улучшитель промптов в Консоли для улучшения вашего промпта.
Токен-эффективное использование инструментов в настоящее время не работает с disable_parallel_tool_use
.
Модели Claude 4 (Opus 4.1, Opus 4 и Sonnet 4) не поддерживают эту функцию. Бета-заголовок token-efficient-tools-2025-02-19
не нарушит API-запрос, но приведет к отсутствию операции.
Чтобы использовать эту бета-функцию, просто добавьте бета-заголовок token-efficient-tools-2025-02-19
к запросу использования инструментов. Если вы используете SDK, убедитесь, что вы используете бета SDK с anthropic.beta.messages
.
Вот пример того, как использовать токен-эффективные инструменты с API:
Приведенный выше запрос должен, в среднем, использовать меньше входных и выходных токенов, чем обычный запрос. Чтобы подтвердить это, попробуйте сделать тот же запрос, но удалите token-efficient-tools-2025-02-19
из списка бета-заголовков.
Чтобы сохранить преимущества кэширования промптов, используйте бета-заголовок последовательно для запросов, которые вы хотели бы кэшировать. Если вы используете его выборочно, кэширование промптов не сработает.