- En Vertex,
modelno se pasa en el cuerpo de la solicitud. En su lugar, se especifica en la URL del punto de conexión de Google Cloud. - En Vertex,
anthropic_versionse pasa en el cuerpo de la solicitud (en lugar de como encabezado) y debe establecerse en el valorvertex-2023-10-16.
Instalar un SDK para acceder a Vertex AI
Primero, instala el SDK de cliente de Anthropic para el lenguaje de tu elección.Acceder a Vertex AI
Disponibilidad de modelos
Ten en cuenta que la disponibilidad del modelo Anthropic varía según la región. Busca “Claude” en el Vertex AI Model Garden o ve a Usar Claude 3 para obtener la información más reciente.ID de modelo de la API
| Modelo | ID de modelo de la API de Vertex AI |
|---|---|
| Claude Sonnet 4.5 | claude-sonnet-4-5@20250929Copied! |
| Claude Sonnet 4 | claude-sonnet-4@20250514Copied! |
| Claude Sonnet 3.7 | claude-3-7-sonnet@20250219Copied! |
| Claude Opus 4.1 | claude-opus-4-1@20250805Copied! |
| Claude Opus 4 | claude-opus-4@20250514Copied! |
| Claude Opus 3 | claude-3-opus@20240229Copied! |
| Claude Haiku 4.5 | claude-haiku-4-5@20251001Copied! |
| Claude Haiku 3.5 | claude-3-5-haiku@20241022Copied! |
| Claude Haiku 3 | claude-3-haiku@20240307Copied! |
Realizar solicitudes
Antes de ejecutar solicitudes, es posible que debas ejecutargcloud auth application-default login para autenticarte con GCP.
Los siguientes ejemplos muestran cómo generar texto desde Claude en Vertex AI:
Registro de actividad
Vertex proporciona un servicio de registro de solicitud-respuesta que permite a los clientes registrar los mensajes y las finalizaciones asociados con tu uso. Anthropic recomienda que registres tu actividad al menos en una base móvil de 30 días para comprender tu actividad e investigar cualquier posible mal uso.Activar este servicio no le da a Google ni a Anthropic acceso a tu contenido.
Soporte de características
Puedes encontrar todas las características actualmente compatibles en Vertex aquí.Puntos de conexión globales frente a regionales
A partir de Claude Sonnet 4.5 y todos los modelos futuros, Google Vertex AI ofrece dos tipos de puntos de conexión:- Puntos de conexión globales: Enrutamiento dinámico para máxima disponibilidad
- Puntos de conexión regionales: Enrutamiento de datos garantizado a través de regiones geográficas específicas
Esto se aplica solo a Claude Sonnet 4.5 y modelos futuros. Los modelos más antiguos (Claude Sonnet 4, Opus 4 y anteriores) mantienen sus estructuras de precios existentes.
Cuándo usar cada opción
Puntos de conexión globales (recomendado):- Proporcionan máxima disponibilidad y tiempo de actividad
- Enrutan dinámicamente las solicitudes a regiones con capacidad disponible
- Sin prima de precios
- Mejor para aplicaciones donde la residencia de datos es flexible
- Solo admite tráfico de pago por uso (el rendimiento aprovisionado requiere puntos de conexión regionales)
- Enrutan el tráfico a través de regiones geográficas específicas
- Requerido para requisitos de residencia de datos y cumplimiento normativo
- Admiten tanto tráfico de pago por uso como rendimiento aprovisionado
- La prima de precios del 10% refleja los costos de infraestructura para la capacidad regional dedicada
Implementación
Usando puntos de conexión globales (recomendado): Establece el parámetroregion en "global" al inicializar el cliente:
"us-east1" o "europe-west1":
Recursos adicionales
- Precios de Google Vertex AI: cloud.google.com/vertex-ai/generative-ai/pricing
- Documentación de modelos Claude: Claude en Vertex AI
- Publicación del blog de Google: Punto de conexión global para modelos Claude
- Detalles de precios de Anthropic: Documentación de precios