- В Vertex
modelне передается в теле запроса. Вместо этого он указывается в URL конечной точки Google Cloud. - В Vertex
anthropic_versionпередается в теле запроса (а не в качестве заголовка) и должен быть установлен на значениеvertex-2023-10-16.
Установите SDK для доступа к Vertex AI
Сначала установите SDK клиента Anthropic для выбранного вами языка.Доступ к Vertex AI
Доступность моделей
Обратите внимание, что доступность моделей Anthropic варьируется в зависимости от региона. Найдите “Claude” в Vertex AI Model Garden или перейдите на Use Claude 3 для получения последней информации.Идентификаторы моделей API
| Модель | Идентификатор модели Vertex AI API |
|---|---|
| Claude Sonnet 4.5 | claude-sonnet-4-5@20250929Copied! |
| Claude Sonnet 4 | claude-sonnet-4@20250514Copied! |
| Claude Sonnet 3.7 | claude-3-7-sonnet@20250219Copied! |
| Claude Opus 4.1 | claude-opus-4-1@20250805Copied! |
| Claude Opus 4 | claude-opus-4@20250514Copied! |
| Claude Opus 3 | claude-3-opus@20240229Copied! |
| Claude Haiku 4.5 | claude-haiku-4-5@20251001Copied! |
| Claude Haiku 3.5 | claude-3-5-haiku@20241022Copied! |
| Claude Haiku 3 | claude-3-haiku@20240307Copied! |
Создание запросов
Перед выполнением запросов вам может потребоваться запуститьgcloud auth application-default login для аутентификации с GCP.
Следующие примеры показывают, как генерировать текст из Claude на Vertex AI:
Логирование активности
Vertex предоставляет сервис логирования запросов и ответов, который позволяет клиентам регистрировать подсказки и завершения, связанные с вашим использованием. Anthropic рекомендует регистрировать вашу активность по крайней мере на основе 30-дневного скользящего окна, чтобы понять вашу активность и исследовать любой потенциальный неправомерный доступ.Включение этого сервиса не дает Google или Anthropic никакого доступа к вашему контенту.
Поддержка функций
Все функции, которые в настоящее время поддерживаются на Vertex, можно найти здесь.Глобальные и региональные конечные точки
Начиная с Claude Sonnet 4.5 и всех будущих моделей, Google Vertex AI предлагает два типа конечных точек:- Глобальные конечные точки: Динамическая маршрутизация для максимальной доступности
- Региональные конечные точки: Гарантированная маршрутизация данных через определенные географические регионы
Это применяется только к Claude Sonnet 4.5 и будущим моделям. Старые модели (Claude Sonnet 4, Opus 4 и более ранние) сохраняют свои существующие структуры ценообразования.
Когда использовать каждый вариант
Глобальные конечные точки (рекомендуется):- Обеспечивают максимальную доступность и время безотказной работы
- Динамически маршрутизируют запросы в регионы с доступной емкостью
- Без надбавки к цене
- Лучше всего подходят для приложений, где местоположение данных гибко
- Поддерживают только трафик с оплатой по мере использования (пропускная способность по требованию требует региональных конечных точек)
- Маршрутизируют трафик через определенные географические регионы
- Требуются для требований к местоположению данных и соответствию нормативным требованиям
- Поддерживают как трафик с оплатой по мере использования, так и пропускную способность по требованию
- Надбавка в размере 10% к цене отражает затраты на инфраструктуру для выделенной региональной емкости
Реализация
Использование глобальных конечных точек (рекомендуется): Установите параметрregion на "global" при инициализации клиента:
"us-east1" или "europe-west1":
Дополнительные ресурсы
- Ценообразование Google Vertex AI: cloud.google.com/vertex-ai/generative-ai/pricing
- Документация моделей Claude: Claude на Vertex AI
- Пост в блоге Google: Глобальная конечная точка для моделей Claude
- Детали ценообразования Anthropic: Документация по ценообразованию