Claude Code en Google Vertex AI
Aprende sobre la configuración de Claude Code a través de Google Vertex AI, incluyendo configuración, configuración de IAM y solución de problemas.
Prerrequisitos
Antes de configurar Claude Code con Vertex AI, asegúrate de tener:
- Una cuenta de Google Cloud Platform (GCP) con facturación habilitada
- Un proyecto de GCP con la API de Vertex AI habilitada
- Acceso a los modelos de Claude deseados (por ejemplo, Claude Sonnet 4)
- Google Cloud SDK (
gcloud
) instalado y configurado - Cuota asignada en la región de GCP deseada
Configuración de región
Claude Code se puede usar con endpoints tanto globales como regionales de Vertex AI.
Vertex AI puede no soportar los modelos predeterminados de Claude Code en todas las regiones. Es posible que necesites cambiar a una región o modelo soportado.
Vertex AI puede no soportar los modelos predeterminados de Claude Code en endpoints globales. Es posible que necesites cambiar a un endpoint regional o modelo soportado.
Configuración
1. Habilitar la API de Vertex AI
Habilita la API de Vertex AI en tu proyecto de GCP:
2. Solicitar acceso al modelo
Solicita acceso a los modelos de Claude en Vertex AI:
- Navega al Jardín de Modelos de Vertex AI
- Busca modelos “Claude”
- Solicita acceso a los modelos de Claude deseados (por ejemplo, Claude Sonnet 4)
- Espera la aprobación (puede tomar 24-48 horas)
3. Configurar credenciales de GCP
Claude Code usa la autenticación estándar de Google Cloud.
Para más información, consulta la documentación de autenticación de Google Cloud.
Al autenticarse, Claude Code usará automáticamente el ID del proyecto de la variable de entorno ANTHROPIC_VERTEX_PROJECT_ID
. Para anular esto, establece una de estas variables de entorno: GCLOUD_PROJECT
, GOOGLE_CLOUD_PROJECT
, o GOOGLE_APPLICATION_CREDENTIALS
.
4. Configurar Claude Code
Establece las siguientes variables de entorno:
El caché de prompts es soportado automáticamente cuando especificas la bandera efímera cache_control
. Para deshabilitarlo, establece DISABLE_PROMPT_CACHING=1
. Para límites de tasa elevados, contacta al soporte de Google Cloud.
Al usar Vertex AI, los comandos /login
y /logout
están deshabilitados ya que la autenticación se maneja a través de las credenciales de Google Cloud.
5. Configuración del modelo
Claude Code usa estos modelos predeterminados para Vertex AI:
Tipo de modelo | Valor predeterminado |
---|---|
Modelo principal | claude-sonnet-4@20250514 |
Modelo pequeño/rápido | claude-3-5-haiku@20241022 |
Para personalizar modelos:
Configuración de IAM
Asigna los permisos de IAM requeridos:
El rol roles/aiplatform.user
incluye los permisos requeridos:
aiplatform.endpoints.predict
- Requerido para invocación del modeloaiplatform.endpoints.computeTokens
- Requerido para conteo de tokens
Para permisos más restrictivos, crea un rol personalizado con solo los permisos anteriores.
Para detalles, consulta la documentación de IAM de Vertex.
Recomendamos crear un proyecto de GCP dedicado para Claude Code para simplificar el seguimiento de costos y el control de acceso.
Ventana de contexto de 1M tokens
Claude Sonnet 4 soporta la ventana de contexto de 1M tokens en Vertex AI.
La ventana de contexto de 1M tokens está actualmente en beta. Para usar la ventana de contexto extendida, incluye el encabezado beta context-1m-2025-08-07
en tus solicitudes de Vertex AI.
Solución de problemas
Si encuentras problemas de cuota:
- Verifica las cuotas actuales o solicita un aumento de cuota a través de Cloud Console
Si encuentras errores 404 de “modelo no encontrado”:
- Confirma que el modelo esté Habilitado en Model Garden
- Verifica que tengas acceso a la región especificada
- Si usas
CLOUD_ML_REGION=global
, verifica que tus modelos soporten endpoints globales en Model Garden bajo “Características soportadas”. Para modelos que no soporten endpoints globales, ya sea:- Especifica un modelo soportado vía
ANTHROPIC_MODEL
oANTHROPIC_SMALL_FAST_MODEL
, o - Establece un endpoint regional usando las variables de entorno
VERTEX_REGION_<MODEL_NAME>
- Especifica un modelo soportado vía
Si encuentras errores 429:
- Para endpoints regionales, asegúrate de que el modelo principal y el modelo pequeño/rápido estén soportados en tu región seleccionada
- Considera cambiar a
CLOUD_ML_REGION=global
para mejor disponibilidad