Предварительные требования
Перед настройкой Claude Code с Vertex AI убедитесь, что у вас есть:- Учетная запись Google Cloud Platform (GCP) с включенной биллингом
- Проект GCP с включенным API Vertex AI
- Доступ к желаемым моделям Claude (например, Claude Sonnet 4.5)
- Установленный и настроенный Google Cloud SDK (
gcloud) - Квота, выделенная в желаемом регионе GCP
Конфигурация региона
Claude Code можно использовать как с глобальными, так и с региональными конечными точками Vertex AI.Vertex AI может не поддерживать модели Claude Code по умолчанию во всех регионах. Вам может потребоваться переключиться на поддерживаемый регион или модель.
Vertex AI может не поддерживать модели Claude Code по умолчанию на глобальных конечных точках. Вам может потребоваться переключиться на региональную конечную точку или поддерживаемую модель.
Установка
1. Включите API Vertex AI
Включите API Vertex AI в вашем проекте GCP:2. Запросите доступ к модели
Запросите доступ к моделям Claude в Vertex AI:- Перейдите в Vertex AI Model Garden
- Найдите модели “Claude”
- Запросите доступ к желаемым моделям Claude (например, Claude Sonnet 4.5)
- Дождитесь одобрения (может занять 24-48 часов)
3. Настройте учетные данные GCP
Claude Code использует стандартную аутентификацию Google Cloud. Для получения дополнительной информации см. документацию по аутентификации Google Cloud.При аутентификации Claude Code автоматически будет использовать ID проекта из переменной окружения
ANTHROPIC_VERTEX_PROJECT_ID. Чтобы переопределить это, установите одну из этих переменных окружения: GCLOUD_PROJECT, GOOGLE_CLOUD_PROJECT или GOOGLE_APPLICATION_CREDENTIALS.4. Настройте Claude Code
Установите следующие переменные окружения:Кэширование подсказок автоматически поддерживается при указании флага
cache_control ephemeral. Чтобы отключить его, установите DISABLE_PROMPT_CACHING=1. Для повышенных ограничений скорости обратитесь в службу поддержки Google Cloud.При использовании Vertex AI команды
/login и /logout отключены, так как аутентификация обрабатывается через учетные данные Google Cloud.5. Конфигурация модели
Claude Code использует эти модели по умолчанию для Vertex AI:| Тип модели | Значение по умолчанию |
|---|---|
| Основная модель | claude-sonnet-4-5@20250929 |
| Малая/быстрая модель | claude-haiku-4-5@20251001 |
Для пользователей Vertex AI Claude Code не будет автоматически обновляться с Haiku 3.5 на Haiku 4.5. Чтобы вручную переключиться на более новую модель Haiku, установите переменную окружения
ANTHROPIC_DEFAULT_HAIKU_MODEL на полное имя модели (например, claude-haiku-4-5@20251001).Конфигурация IAM
Назначьте требуемые разрешения IAM: Рольroles/aiplatform.user включает требуемые разрешения:
aiplatform.endpoints.predict- требуется для вызова модели и подсчета токенов
Мы рекомендуем создать выделенный проект GCP для Claude Code, чтобы упростить отслеживание затрат и управление доступом.
Контекстное окно из 1 млн токенов
Claude Sonnet 4 и Sonnet 4.5 поддерживают контекстное окно из 1 млн токенов на Vertex AI.Контекстное окно из 1 млн токенов в настоящее время находится в бета-версии. Чтобы использовать расширенное контекстное окно, включите заголовок бета-версии
context-1m-2025-08-07 в ваши запросы Vertex AI.Устранение неполадок
Если у вас возникают проблемы с квотой:- Проверьте текущие квоты или запросите увеличение квоты через Cloud Console
- Подтвердите, что модель включена в Model Garden
- Проверьте, что у вас есть доступ к указанному региону
- Если используется
CLOUD_ML_REGION=global, проверьте, что ваши модели поддерживают глобальные конечные точки в Model Garden в разделе “Поддерживаемые функции”. Для моделей, которые не поддерживают глобальные конечные точки, либо:- Укажите поддерживаемую модель через
ANTHROPIC_MODELилиANTHROPIC_SMALL_FAST_MODEL, либо - Установите региональную конечную точку, используя переменные окружения
VERTEX_REGION_<MODEL_NAME>
- Укажите поддерживаемую модель через
- Для региональных конечных точек убедитесь, что основная модель и малая/быстрая модель поддерживаются в выбранном регионе
- Рассмотрите возможность переключения на
CLOUD_ML_REGION=globalдля лучшей доступности