- 在 Vertex 中,
model不在請求正文中傳遞。相反,它在 Google Cloud 端點 URL 中指定。 - 在 Vertex 中,
anthropic_version在請求正文中傳遞(而不是作為標頭),並且必須設定為值vertex-2023-10-16。
安裝用於存取 Vertex AI 的 SDK
首先,為您選擇的語言安裝 Anthropic 的 client SDK。存取 Vertex AI
模型可用性
請注意,Anthropic 模型的可用性因地區而異。在 Vertex AI Model Garden 中搜尋「Claude」或前往 使用 Claude 3 以取得最新資訊。API 模型 ID
| 模型 | Vertex AI API 模型 ID |
|---|---|
| Claude Sonnet 4.5 | claude-sonnet-4-5@20250929Copied! |
| Claude Sonnet 4 | claude-sonnet-4@20250514Copied! |
| Claude Sonnet 3.7 | claude-3-7-sonnet@20250219Copied! |
| Claude Opus 4.1 | claude-opus-4-1@20250805Copied! |
| Claude Opus 4 | claude-opus-4@20250514Copied! |
| Claude Opus 3 | claude-3-opus@20240229Copied! |
| Claude Haiku 4.5 | claude-haiku-4-5@20251001Copied! |
| Claude Haiku 3.5 | claude-3-5-haiku@20241022Copied! |
| Claude Haiku 3 | claude-3-haiku@20240307Copied! |
發出請求
在執行請求之前,您可能需要執行gcloud auth application-default login 以使用 GCP 進行身份驗證。
以下範例顯示如何從 Vertex AI 上的 Claude 產生文字:
活動記錄
Vertex 提供 請求-回應記錄服務,允許客戶記錄與您的使用相關的提示和完成。 Anthropic 建議您至少在 30 天滾動基礎上記錄您的活動,以便瞭解您的活動並調查任何潛在的濫用。啟用此服務不會給 Google 或 Anthropic 任何存取您內容的權限。
功能支援
您可以在 此處 找到 Vertex 上目前支援的所有功能。全球端點與區域端點
從 Claude Sonnet 4.5 和所有未來模型 開始,Google Vertex AI 提供兩種端點類型:- 全球端點:動態路由以實現最大可用性
- 區域端點:保證透過特定地理區域的資料路由
這僅適用於 Claude Sonnet 4.5 和未來的模型。較舊的模型(Claude Sonnet 4、Opus 4 及更早版本)保持其現有的定價結構。
何時使用各選項
全球端點(推薦):- 提供最大可用性和正常運行時間
- 動態將請求路由到具有可用容量的區域
- 無定價溢價
- 最適合資料駐留靈活的應用程式
- 僅支援按使用量付費流量(佈建的輸送量需要區域端點)
- 透過特定地理區域路由流量
- 資料駐留和合規性要求所需
- 支援按使用量付費和佈建的輸送量
- 10% 的定價溢價反映了專用區域容量的基礎設施成本
實施
使用全球端點(推薦): 初始化用戶端時將region 參數設定為 "global":
"us-east1" 或 "europe-west1":
其他資源
- Google Vertex AI 定價: cloud.google.com/vertex-ai/generative-ai/pricing
- Claude 模型文件: Vertex AI 上的 Claude
- Google 部落格文章: Claude 模型的全球端點
- Anthropic 定價詳細資訊: 定價文件