La API de Vertex para acceder a Claude es casi idéntica a la API de Mensajes y admite todas las mismas opciones, con dos diferencias clave:
  • En Vertex, model no se pasa en el cuerpo de la solicitud. En su lugar, se especifica en la URL del punto de conexión de Google Cloud.
  • En Vertex, anthropic_version se pasa en el cuerpo de la solicitud (en lugar de como encabezado) y debe establecerse en el valor vertex-2023-10-16.
Vertex también es compatible con los SDK de cliente oficiales de Anthropic. Esta guía te guiará a través del proceso de realizar una solicitud a Claude en Vertex AI en Python o TypeScript. Ten en cuenta que esta guía asume que ya tienes un proyecto de GCP que puede usar Vertex AI. Consulta usar los modelos Claude 3 de Anthropic para obtener más información sobre la configuración requerida, así como un tutorial completo.

Instalar un SDK para acceder a Vertex AI

Primero, instala el SDK de cliente de Anthropic para el lenguaje de tu elección.
pip install -U google-cloud-aiplatform "anthropic[vertex]"

Acceder a Vertex AI

Disponibilidad de modelos

Ten en cuenta que la disponibilidad del modelo Anthropic varía según la región. Busca “Claude” en el Vertex AI Model Garden o ve a Usar Claude 3 para obtener la información más reciente.

ID de modelo de la API

ModeloID de modelo de la API de Vertex AI
Claude Sonnet 4.5claude-sonnet-4-5@20250929Copied!
Claude Sonnet 4claude-sonnet-4@20250514Copied!
Claude Sonnet 3.7 claude-3-7-sonnet@20250219Copied!
Claude Opus 4.1claude-opus-4-1@20250805Copied!
Claude Opus 4claude-opus-4@20250514Copied!
Claude Opus 3 claude-3-opus@20240229Copied!
Claude Haiku 4.5claude-haiku-4-5@20251001Copied!
Claude Haiku 3.5claude-3-5-haiku@20241022Copied!
Claude Haiku 3claude-3-haiku@20240307Copied!

Realizar solicitudes

Antes de ejecutar solicitudes, es posible que debas ejecutar gcloud auth application-default login para autenticarte con GCP. Los siguientes ejemplos muestran cómo generar texto desde Claude en Vertex AI:
from anthropic import AnthropicVertex

project_id = "MY_PROJECT_ID"
region = "global"

client = AnthropicVertex(project_id=project_id, region=region)

message = client.messages.create(
    model="claude-sonnet-4-5@20250929",
    max_tokens=100,
    messages=[
        {
            "role": "user",
            "content": "Hey Claude!",
        }
    ],
)
print(message)
Consulta nuestros SDK de cliente y la documentación oficial de Vertex AI para obtener más detalles.

Registro de actividad

Vertex proporciona un servicio de registro de solicitud-respuesta que permite a los clientes registrar los mensajes y las finalizaciones asociados con tu uso. Anthropic recomienda que registres tu actividad al menos en una base móvil de 30 días para comprender tu actividad e investigar cualquier posible mal uso.
Activar este servicio no le da a Google ni a Anthropic acceso a tu contenido.

Soporte de características

Puedes encontrar todas las características actualmente compatibles en Vertex aquí.

Puntos de conexión globales frente a regionales

A partir de Claude Sonnet 4.5 y todos los modelos futuros, Google Vertex AI ofrece dos tipos de puntos de conexión:
  • Puntos de conexión globales: Enrutamiento dinámico para máxima disponibilidad
  • Puntos de conexión regionales: Enrutamiento de datos garantizado a través de regiones geográficas específicas
Los puntos de conexión regionales incluyen una prima de precios del 10% sobre los puntos de conexión globales.
Esto se aplica solo a Claude Sonnet 4.5 y modelos futuros. Los modelos más antiguos (Claude Sonnet 4, Opus 4 y anteriores) mantienen sus estructuras de precios existentes.

Cuándo usar cada opción

Puntos de conexión globales (recomendado):
  • Proporcionan máxima disponibilidad y tiempo de actividad
  • Enrutan dinámicamente las solicitudes a regiones con capacidad disponible
  • Sin prima de precios
  • Mejor para aplicaciones donde la residencia de datos es flexible
  • Solo admite tráfico de pago por uso (el rendimiento aprovisionado requiere puntos de conexión regionales)
Puntos de conexión regionales:
  • Enrutan el tráfico a través de regiones geográficas específicas
  • Requerido para requisitos de residencia de datos y cumplimiento normativo
  • Admiten tanto tráfico de pago por uso como rendimiento aprovisionado
  • La prima de precios del 10% refleja los costos de infraestructura para la capacidad regional dedicada

Implementación

Usando puntos de conexión globales (recomendado): Establece el parámetro region en "global" al inicializar el cliente:
from anthropic import AnthropicVertex

project_id = "MY_PROJECT_ID"
region = "global"

client = AnthropicVertex(project_id=project_id, region=region)

message = client.messages.create(
    model="claude-sonnet-4-5@20250929",
    max_tokens=100,
    messages=[
        {
            "role": "user",
            "content": "Hey Claude!",
        }
    ],
)
print(message)
Usando puntos de conexión regionales: Especifica una región específica como "us-east1" o "europe-west1":
from anthropic import AnthropicVertex

project_id = "MY_PROJECT_ID"
region = "us-east1"  # Specify a specific region

client = AnthropicVertex(project_id=project_id, region=region)

message = client.messages.create(
    model="claude-sonnet-4-5@20250929",
    max_tokens=100,
    messages=[
        {
            "role": "user",
            "content": "Hey Claude!",
        }
    ],
)
print(message)

Recursos adicionales