- 在 Vertex 中,
model不在请求体中传递。相反,它在 Google Cloud 端点 URL 中指定。 - 在 Vertex 中,
anthropic_version在请求体中传递(而不是作为标头),并且必须设置为值vertex-2023-10-16。
安装用于访问 Vertex AI 的 SDK
首先,为您选择的语言安装 Anthropic 的 客户端 SDK。访问 Vertex AI
模型可用性
请注意,Anthropic 模型的可用性因地区而异。在 Vertex AI 模型库 中搜索”Claude”或转到 使用 Claude 3 以获取最新信息。API 模型 ID
| 模型 | Vertex AI API 模型 ID |
|---|---|
| Claude Sonnet 4.5 | claude-sonnet-4-5@20250929Copied! |
| Claude Sonnet 4 | claude-sonnet-4@20250514Copied! |
| Claude Sonnet 3.7 | claude-3-7-sonnet@20250219Copied! |
| Claude Sonnet 3.5 | claude-3-5-sonnet-v2@20241022Copied! |
| Claude Opus 4.1 | claude-opus-4-1@20250805Copied! |
| Claude Opus 4 | claude-opus-4@20250514Copied! |
| Claude Opus 3 | claude-3-opus@20240229Copied! |
| Claude Haiku 4.5 | claude-haiku-4-5@20251001Copied! |
| Claude Haiku 3.5 | claude-3-5-haiku@20241022Copied! |
| Claude Haiku 3 | claude-3-haiku@20240307Copied! |
发出请求
在运行请求之前,您可能需要运行gcloud auth application-default login 来使用 GCP 进行身份验证。
以下示例展示了如何从 Vertex AI 上的 Claude 生成文本:
活动日志
Vertex 提供了一个 请求-响应日志服务,允许客户记录与您的使用相关的提示和完成。 Anthropic 建议您至少在 30 天滚动基础上记录您的活动,以便了解您的活动并调查任何潜在的滥用。启用此服务不会给 Google 或 Anthropic 任何访问您内容的权限。
功能支持
您可以在 此处 找到 Vertex 上当前支持的所有功能。全局端点与区域端点
从 Claude Sonnet 4.5 和所有未来模型 开始,Google Vertex AI 提供两种端点类型:- 全局端点:动态路由以实现最大可用性
- 区域端点:通过特定地理区域保证数据路由
这仅适用于 Claude Sonnet 4.5 和未来的模型。较旧的模型(Claude Sonnet 4、Opus 4 及更早版本)保持其现有的定价结构。
何时使用每个选项
全局端点(推荐):- 提供最大可用性和正常运行时间
- 动态将请求路由到具有可用容量的区域
- 无价格溢价
- 最适合数据驻留灵活的应用程序
- 仅支持按使用量付费流量(预配置吞吐量需要区域端点)
- 通过特定地理区域路由流量
- 数据驻留和合规要求所需
- 支持按使用量付费和预配置吞吐量
- 10% 的价格溢价反映了专用区域容量的基础设施成本
实现
使用全局端点(推荐): 在初始化客户端时将region 参数设置为 "global":
"us-east1" 或 "europe-west1":
其他资源
- Google Vertex AI 定价: cloud.google.com/vertex-ai/generative-ai/pricing
- Claude 模型文档: Vertex AI 上的 Claude
- Google 博客文章: Claude 模型的全局端点
- Anthropic 定价详情: 定价文档