API Vertex для доступа к Claude почти идентичен Messages API и поддерживает все те же параметры с двумя ключевыми отличиями:
  • В Vertex model не передается в теле запроса. Вместо этого он указывается в URL конечной точки Google Cloud.
  • В Vertex anthropic_version передается в теле запроса (а не в качестве заголовка) и должен быть установлен на значение vertex-2023-10-16.
Vertex также поддерживается официальными SDK клиентов Anthropic. Это руководство проведет вас через процесс создания запроса к Claude на Vertex AI на Python или TypeScript. Обратите внимание, что это руководство предполагает, что у вас уже есть проект GCP, который может использовать Vertex AI. Дополнительную информацию о требуемой настройке и полное пошаговое руководство см. в разделе использование моделей Claude 3 от Anthropic.

Установите SDK для доступа к Vertex AI

Сначала установите SDK клиента Anthropic для выбранного вами языка.
pip install -U google-cloud-aiplatform "anthropic[vertex]"

Доступ к Vertex AI

Доступность моделей

Обратите внимание, что доступность моделей Anthropic варьируется в зависимости от региона. Найдите “Claude” в Vertex AI Model Garden или перейдите на Use Claude 3 для получения последней информации.

Идентификаторы моделей API

МодельИдентификатор модели Vertex AI API
Claude Sonnet 4.5claude-sonnet-4-5@20250929Copied!
Claude Sonnet 4claude-sonnet-4@20250514Copied!
Claude Sonnet 3.7 claude-3-7-sonnet@20250219Copied!
Claude Opus 4.1claude-opus-4-1@20250805Copied!
Claude Opus 4claude-opus-4@20250514Copied!
Claude Opus 3 claude-3-opus@20240229Copied!
Claude Haiku 4.5claude-haiku-4-5@20251001Copied!
Claude Haiku 3.5claude-3-5-haiku@20241022Copied!
Claude Haiku 3claude-3-haiku@20240307Copied!

Создание запросов

Перед выполнением запросов вам может потребоваться запустить gcloud auth application-default login для аутентификации с GCP. Следующие примеры показывают, как генерировать текст из Claude на Vertex AI:
from anthropic import AnthropicVertex

project_id = "MY_PROJECT_ID"
region = "global"

client = AnthropicVertex(project_id=project_id, region=region)

message = client.messages.create(
    model="claude-sonnet-4-5@20250929",
    max_tokens=100,
    messages=[
        {
            "role": "user",
            "content": "Hey Claude!",
        }
    ],
)
print(message)
Дополнительные сведения см. в наших SDK клиентов и официальной документации Vertex AI.

Логирование активности

Vertex предоставляет сервис логирования запросов и ответов, который позволяет клиентам регистрировать подсказки и завершения, связанные с вашим использованием. Anthropic рекомендует регистрировать вашу активность по крайней мере на основе 30-дневного скользящего окна, чтобы понять вашу активность и исследовать любой потенциальный неправомерный доступ.
Включение этого сервиса не дает Google или Anthropic никакого доступа к вашему контенту.

Поддержка функций

Все функции, которые в настоящее время поддерживаются на Vertex, можно найти здесь.

Глобальные и региональные конечные точки

Начиная с Claude Sonnet 4.5 и всех будущих моделей, Google Vertex AI предлагает два типа конечных точек:
  • Глобальные конечные точки: Динамическая маршрутизация для максимальной доступности
  • Региональные конечные точки: Гарантированная маршрутизация данных через определенные географические регионы
Региональные конечные точки включают надбавку в размере 10% к цене по сравнению с глобальными конечными точками.
Это применяется только к Claude Sonnet 4.5 и будущим моделям. Старые модели (Claude Sonnet 4, Opus 4 и более ранние) сохраняют свои существующие структуры ценообразования.

Когда использовать каждый вариант

Глобальные конечные точки (рекомендуется):
  • Обеспечивают максимальную доступность и время безотказной работы
  • Динамически маршрутизируют запросы в регионы с доступной емкостью
  • Без надбавки к цене
  • Лучше всего подходят для приложений, где местоположение данных гибко
  • Поддерживают только трафик с оплатой по мере использования (пропускная способность по требованию требует региональных конечных точек)
Региональные конечные точки:
  • Маршрутизируют трафик через определенные географические регионы
  • Требуются для требований к местоположению данных и соответствию нормативным требованиям
  • Поддерживают как трафик с оплатой по мере использования, так и пропускную способность по требованию
  • Надбавка в размере 10% к цене отражает затраты на инфраструктуру для выделенной региональной емкости

Реализация

Использование глобальных конечных точек (рекомендуется): Установите параметр region на "global" при инициализации клиента:
from anthropic import AnthropicVertex

project_id = "MY_PROJECT_ID"
region = "global"

client = AnthropicVertex(project_id=project_id, region=region)

message = client.messages.create(
    model="claude-sonnet-4-5@20250929",
    max_tokens=100,
    messages=[
        {
            "role": "user",
            "content": "Hey Claude!",
        }
    ],
)
print(message)
Использование региональных конечных точек: Укажите конкретный регион, например "us-east1" или "europe-west1":
from anthropic import AnthropicVertex

project_id = "MY_PROJECT_ID"
region = "us-east1"  # Specify a specific region

client = AnthropicVertex(project_id=project_id, region=region)

message = client.messages.create(
    model="claude-sonnet-4-5@20250929",
    max_tokens=100,
    messages=[
        {
            "role": "user",
            "content": "Hey Claude!",
        }
    ],
)
print(message)

Дополнительные ресурсы