Uso de herramientas eficiente en tokens
Uso de herramientas eficiente en tokens
Claude Sonnet 3.7 es capaz de llamar herramientas de manera eficiente en tokens. Las solicitudes ahorran un promedio del 14% en tokens de salida, hasta un 70%, lo que también reduce la latencia. La reducción exacta de tokens y las mejoras de latencia dependen de la forma y el tamaño general de la respuesta.
El uso de herramientas eficiente en tokens es una característica beta. Por favor, asegúrese de evaluar sus respuestas antes de usarla en producción.
Por favor use este formulario para proporcionar comentarios sobre la calidad de las respuestas del modelo, la API en sí, o la calidad de la documentación—¡no podemos esperar a escuchar de usted!
Si elige experimentar con esta característica, recomendamos usar el Mejorador de Prompts en la Consola para mejorar su prompt.
El uso de herramientas eficiente en tokens actualmente no funciona con disable_parallel_tool_use
.
Los modelos Claude 4 (Opus 4.1, Opus 4, y Sonnet 4) no soportan esta característica. El encabezado beta token-efficient-tools-2025-02-19
no romperá una solicitud de API, pero resultará en una no-operación.
Para usar esta característica beta, simplemente agregue el encabezado beta token-efficient-tools-2025-02-19
a una solicitud de uso de herramientas. Si está usando el SDK, asegúrese de que está usando el SDK beta con anthropic.beta.messages
.
Aquí hay un ejemplo de cómo usar herramientas eficientes en tokens con la API:
La solicitud anterior debería, en promedio, usar menos tokens de entrada y salida que una solicitud normal. Para confirmar esto, intente hacer la misma solicitud pero elimine token-efficient-tools-2025-02-19
de la lista de encabezados beta.
Para mantener los beneficios del almacenamiento en caché de prompts, use el encabezado beta de manera consistente para las solicitudes que le gustaría almacenar en caché. Si lo usa selectivamente, el almacenamiento en caché de prompts fallará.