Elegir un modelo

En general, usa Claude Opus 4.1, Claude Opus 4, Claude Sonnet 4, Claude Sonnet 3.7, Claude Sonnet 3.5 (obsoleto) o Claude Opus 3 (obsoleto) para herramientas complejas y consultas ambiguas; manejan mejor múltiples herramientas y buscan aclaración cuando es necesario.

Usa Claude Haiku 3.5 o Claude Haiku 3 para herramientas sencillas, pero ten en cuenta que pueden inferir parámetros faltantes.

Si usas Claude Sonnet 3.7 con uso de herramientas y pensamiento extendido, consulta nuestra guía aquí para más información.

Especificar herramientas del cliente

Las herramientas del cliente (tanto las definidas por Anthropic como las definidas por el usuario) se especifican en el parámetro de nivel superior tools de la solicitud de API. Cada definición de herramienta incluye:

ParámetroDescripción
nameEl nombre de la herramienta. Debe coincidir con la expresión regular ^[a-zA-Z0-9_-]{1,64}$.
descriptionUna descripción detallada en texto plano de lo que hace la herramienta, cuándo debe usarse y cómo se comporta.
input_schemaUn objeto JSON Schema que define los parámetros esperados para la herramienta.

Prompt del sistema para uso de herramientas

Cuando llamas a la API de Anthropic con el parámetro tools, construimos un prompt del sistema especial a partir de las definiciones de herramientas, la configuración de herramientas y cualquier prompt del sistema especificado por el usuario. El prompt construido está diseñado para instruir al modelo a usar las herramientas especificadas y proporcionar el contexto necesario para que la herramienta opere correctamente:

En este entorno tienes acceso a un conjunto de herramientas que puedes usar para responder la pregunta del usuario.
{{ INSTRUCCIONES DE FORMATO }}
Los parámetros de cadena y escalares deben especificarse tal como están, mientras que las listas y objetos deben usar formato JSON. Ten en cuenta que los espacios para valores de cadena no se eliminan. La salida no se espera que sea XML válido y se analiza con expresiones regulares.
Aquí están las funciones disponibles en formato JSONSchema:
{{ DEFINICIONES DE HERRAMIENTAS EN JSON SCHEMA }}
{{ PROMPT DEL SISTEMA DEL USUARIO }}
{{ CONFIGURACIÓN DE HERRAMIENTAS }}

Mejores prácticas para definiciones de herramientas

Para obtener el mejor rendimiento de Claude al usar herramientas, sigue estas pautas:

  • Proporciona descripciones extremadamente detalladas. Este es, por mucho, el factor más importante en el rendimiento de las herramientas. Tus descripciones deben explicar cada detalle sobre la herramienta, incluyendo:
    • Qué hace la herramienta
    • Cuándo debe usarse (y cuándo no debe usarse)
    • Qué significa cada parámetro y cómo afecta el comportamiento de la herramienta
    • Cualquier advertencia o limitación importante, como qué información no devuelve la herramienta si el nombre de la herramienta no es claro. Mientras más contexto puedas dar a Claude sobre tus herramientas, mejor será para decidir cuándo y cómo usarlas. Apunta a al menos 3-4 oraciones por descripción de herramienta, más si la herramienta es compleja.
  • Prioriza las descripciones sobre los ejemplos. Aunque puedes incluir ejemplos de cómo usar una herramienta en su descripción o en el prompt que la acompaña, esto es menos importante que tener una explicación clara y completa del propósito y parámetros de la herramienta. Solo agrega ejemplos después de haber desarrollado completamente la descripción.

La buena descripción explica claramente qué hace la herramienta, cuándo usarla, qué datos devuelve y qué significa el parámetro ticker. La descripción pobre es demasiado breve y deja a Claude con muchas preguntas abiertas sobre el comportamiento y uso de la herramienta.

Controlar la salida de Claude

Forzar el uso de herramientas

En algunos casos, puedes querer que Claude use una herramienta específica para responder la pregunta del usuario, incluso si Claude piensa que puede proporcionar una respuesta sin usar una herramienta. Puedes hacer esto especificando la herramienta en el campo tool_choice así:

tool_choice = {"type": "tool", "name": "get_weather"}

Al trabajar con el parámetro tool_choice, tenemos cuatro opciones posibles:

  • auto permite a Claude decidir si llamar cualquiera de las herramientas proporcionadas o no. Este es el valor predeterminado cuando se proporcionan tools.
  • any le dice a Claude que debe usar una de las herramientas proporcionadas, pero no fuerza una herramienta particular.
  • tool nos permite forzar a Claude a usar siempre una herramienta particular.
  • none evita que Claude use cualquier herramienta. Este es el valor predeterminado cuando no se proporcionan tools.

Al usar caché de prompts, los cambios al parámetro tool_choice invalidarán los bloques de mensajes en caché. Las definiciones de herramientas y prompts del sistema permanecen en caché, pero el contenido del mensaje debe reprocesarse.

Este diagrama ilustra cómo funciona cada opción:

Ten en cuenta que cuando tienes tool_choice como any o tool, prellenaremos el mensaje del asistente para forzar que se use una herramienta. Esto significa que los modelos no emitirán un bloque de contenido text de cadena de pensamiento antes de los bloques de contenido tool_use, incluso si se les pide explícitamente que lo hagan.

Al usar pensamiento extendido con uso de herramientas, tool_choice: {"type": "any"} y tool_choice: {"type": "tool", "name": "..."} no son compatibles y resultarán en un error. Solo tool_choice: {"type": "auto"} (el predeterminado) y tool_choice: {"type": "none"} son compatibles con el pensamiento extendido.

Nuestras pruebas han mostrado que esto no debería reducir el rendimiento. Si quisieras mantener la cadena de pensamiento (particularmente con Opus) mientras aún solicitas que el modelo use una herramienta específica, puedes usar {"type": "auto"} para tool_choice (el predeterminado) y agregar instrucciones explícitas en un mensaje user. Por ejemplo: ¿Cómo está el clima en Londres? Usa la herramienta get_weather en tu respuesta.

Salida JSON

Las herramientas no necesariamente necesitan ser funciones del cliente — puedes usar herramientas en cualquier momento que quieras que el modelo devuelva salida JSON que siga un esquema proporcionado. Por ejemplo, podrías usar una herramienta record_summary con un esquema particular. Ve Uso de herramientas con Claude para un ejemplo completo funcional.

Cadena de pensamiento

Al usar herramientas, Claude a menudo mostrará su “cadena de pensamiento”, es decir, el razonamiento paso a paso que usa para descomponer el problema y decidir qué herramientas usar. El modelo Claude Opus 3 (obsoleto) hará esto si tool_choice está configurado en auto (este es el valor predeterminado, ve Forzar el uso de herramientas), y Sonnet y Haiku pueden ser inducidos a hacerlo.

Por ejemplo, dado el prompt “¿Cómo está el clima en San Francisco ahora mismo, y qué hora es allí?”, Claude podría responder con:

JSON
{
  "role": "assistant",
  "content": [
    {
      "type": "text",
      "text": "Para responder esta pregunta, haré: 1. Usar la herramienta get_weather para obtener el clima actual en San Francisco. 2. Usar la herramienta get_time para obtener la hora actual en la zona horaria America/Los_Angeles, que cubre San Francisco, CA."
    },
    {
      "type": "tool_use",
      "id": "toolu_01A09q90qw90lq917835lq9",
      "name": "get_weather",
      "input": {"location": "San Francisco, CA"}
    }
  ]
}

Esta cadena de pensamiento da una visión del proceso de razonamiento de Claude y puede ayudarte a depurar comportamientos inesperados.

Es importante notar que Claude puede usar varios formatos para denotar su cadena de pensamiento. Tu código debe tratar la cadena de pensamiento como cualquier otro texto generado por el asistente, y no depender de convenciones de formato específicas.

Uso paralelo de herramientas

Por defecto, Claude puede usar múltiples herramientas para responder una consulta del usuario. Puedes deshabilitar este comportamiento:

  • Configurando disable_parallel_tool_use=true cuando el tipo de tool_choice es auto, lo que asegura que Claude use como máximo una herramienta
  • Configurando disable_parallel_tool_use=true cuando el tipo de tool_choice es any o tool, lo que asegura que Claude use exactamente una herramienta

Maximizar el uso paralelo de herramientas

Aunque los modelos Claude 4 tienen excelentes capacidades de uso paralelo de herramientas por defecto, puedes aumentar la probabilidad de ejecución paralela de herramientas en todos los modelos con prompting dirigido:

Uso paralelo de herramientas con Claude Sonnet 3.7

Claude Sonnet 3.7 puede ser menos propenso a hacer llamadas de herramientas paralelas en una respuesta, incluso cuando no has configurado disable_parallel_tool_use. Para solucionar esto, recomendamos habilitar uso eficiente de herramientas en tokens, que ayuda a fomentar que Claude use herramientas paralelas. Esta función beta también reduce la latencia y ahorra un promedio de 14% en tokens de salida.

Si prefieres no optar por la beta de uso eficiente de herramientas en tokens, también puedes introducir una “herramienta por lotes” que puede actuar como una meta-herramienta para envolver invocaciones a otras herramientas simultáneamente. Encontramos que si esta herramienta está presente, el modelo la usará para llamar múltiples herramientas en paralelo para ti.

Ve este ejemplo en nuestro cookbook para cómo usar esta solución alternativa.

Manejar bloques de contenido de uso de herramientas y resultados de herramientas

La respuesta de Claude difiere según si usa una herramienta del cliente o del servidor.

Manejar resultados de herramientas del cliente

La respuesta tendrá un stop_reason de tool_use y uno o más bloques de contenido tool_use que incluyen:

  • id: Un identificador único para este bloque particular de uso de herramienta. Esto se usará para hacer coincidir los resultados de la herramienta más tarde.
  • name: El nombre de la herramienta que se está usando.
  • input: Un objeto que contiene la entrada que se pasa a la herramienta, conforme al input_schema de la herramienta.

Cuando recibes una respuesta de uso de herramienta para una herramienta del cliente, debes:

  1. Extraer el name, id e input del bloque tool_use.
  2. Ejecutar la herramienta real en tu código base correspondiente a ese nombre de herramienta, pasando la input de la herramienta.
  3. Continuar la conversación enviando un nuevo mensaje con el role de user, y un bloque content que contenga el tipo tool_result y la siguiente información:
    • tool_use_id: El id de la solicitud de uso de herramienta para la cual este es un resultado.
    • content: El resultado de la herramienta, como una cadena (ej. "content": "15 grados"), una lista de bloques de contenido anidados (ej. "content": [{"type": "text", "text": "15 grados"}]), o una lista de bloques de documento (ej. "content": ["type": "document", "source": {"type": "text", "media_type": "text/plain", "data": "15 grados"}]). Estos bloques de contenido pueden usar los tipos text, image o document.
    • is_error (opcional): Configurar en true si la ejecución de la herramienta resultó en un error.

Requisitos importantes de formato:

  • Los bloques de resultado de herramienta deben seguir inmediatamente a sus bloques de uso de herramienta correspondientes en el historial de mensajes. No puedes incluir ningún mensaje entre el mensaje de uso de herramienta del asistente y el mensaje de resultado de herramienta del usuario.
  • En el mensaje del usuario que contiene resultados de herramientas, los bloques tool_result deben venir PRIMERO en el array de contenido. Cualquier texto debe venir DESPUÉS de todos los resultados de herramientas.

Por ejemplo, esto causará un error 400:

{"role": "user", "content": [
  {"type": "text", "text": "Aquí están los resultados:"},  // ❌ Texto antes de tool_result
  {"type": "tool_result", "tool_use_id": "toolu_01", ...}
]}

Esto es correcto:

{"role": "user", "content": [
  {"type": "tool_result", "tool_use_id": "toolu_01", ...},
  {"type": "text", "text": "¿Qué debo hacer después?"}  // ✅ Texto después de tool_result
]}

Si recibes un error como “se encontraron IDs de tool_use sin bloques tool_result inmediatamente después”, verifica que tus resultados de herramientas estén formateados correctamente.

Después de recibir el resultado de la herramienta, Claude usará esa información para continuar generando una respuesta al prompt original del usuario.

Manejar resultados de herramientas del servidor

Claude ejecuta la herramienta internamente e incorpora los resultados directamente en su respuesta sin requerir interacción adicional del usuario.

Diferencias de otras APIs

A diferencia de las APIs que separan el uso de herramientas o usan roles especiales como tool o function, la API de Anthropic integra las herramientas directamente en la estructura de mensajes user y assistant.

Los mensajes contienen arrays de bloques text, image, tool_use y tool_result. Los mensajes user incluyen contenido del cliente y tool_result, mientras que los mensajes assistant contienen contenido generado por IA y tool_use.

Manejar la razón de parada max_tokens

Si la respuesta de Claude se corta debido a alcanzar el límite de max_tokens, y la respuesta truncada contiene un bloque de uso de herramienta incompleto, necesitarás reintentar la solicitud con un valor de max_tokens más alto para obtener el uso completo de la herramienta.

# Verificar si la respuesta fue truncada durante el uso de herramientas
if response.stop_reason == "max_tokens":
    # Verificar si el último bloque de contenido es un tool_use incompleto
    last_block = response.content[-1]
    if last_block.type == "tool_use":
        # Enviar la solicitud con max_tokens más alto
        response = client.messages.create(
            model="claude-opus-4-1-20250805",
            max_tokens=4096,  # Límite aumentado
            messages=messages,
            tools=tools
        )

Manejar la razón de parada pause_turn

Al usar herramientas del servidor como búsqueda web, la API puede devolver una razón de parada pause_turn, indicando que la API ha pausado un turno de larga duración.

Aquí está cómo manejar la razón de parada pause_turn:

import anthropic

client = anthropic.Anthropic()

# Solicitud inicial con búsqueda web
response = client.messages.create(
    model="claude-3-7-sonnet-latest",
    max_tokens=1024,
    messages=[
        {
            "role": "user",
            "content": "Busca información completa sobre avances en computación cuántica en 2025"
        }
    ],
    tools=[{
        "type": "web_search_20250305",
        "name": "web_search",
        "max_uses": 10
    }]
)

# Verificar si la respuesta tiene razón de parada pause_turn
if response.stop_reason == "pause_turn":
    # Continuar la conversación con el contenido pausado
    messages = [
        {"role": "user", "content": "Busca información completa sobre avances en computación cuántica en 2025"},
        {"role": "assistant", "content": response.content}
    ]
    
    # Enviar la solicitud de continuación
    continuation = client.messages.create(
        model="claude-3-7-sonnet-latest",
        max_tokens=1024,
        messages=messages,
        tools=[{
            "type": "web_search_20250305",
            "name": "web_search",
            "max_uses": 10
        }]
    )
    
    print(continuation)
else:
    print(response)

Al manejar pause_turn:

  • Continúa la conversación: Pasa la respuesta pausada tal como está en una solicitud posterior para permitir que Claude continúe su turno
  • Modifica si es necesario: Opcionalmente puedes modificar el contenido antes de continuar si quieres interrumpir o redirigir la conversación
  • **Preserva el estado de la herrami

enta**: Incluye las mismas herramientas en la solicitud de continuación para mantener la funcionalidad

Solucionar errores

Hay algunos tipos diferentes de errores que pueden ocurrir al usar herramientas con Claude: