用於存取 Claude 的 Vertex API 幾乎與 Messages API 相同,並支援所有相同的選項,但有兩個主要差異:
  • 在 Vertex 中,model 不在請求正文中傳遞。相反,它在 Google Cloud 端點 URL 中指定。
  • 在 Vertex 中,anthropic_version 在請求正文中傳遞(而不是作為標頭),並且必須設定為值 vertex-2023-10-16
Vertex 也受到 Anthropic 官方 client SDKs 的支援。本指南將引導您完成使用 Python 或 TypeScript 向 Vertex AI 上的 Claude 發出請求的過程。 請注意,本指南假設您已經擁有能夠使用 Vertex AI 的 GCP 專案。有關所需的設定以及完整的逐步說明,請參閱 使用 Anthropic 的 Claude 3 模型

安裝用於存取 Vertex AI 的 SDK

首先,為您選擇的語言安裝 Anthropic 的 client SDK
pip install -U google-cloud-aiplatform "anthropic[vertex]"

存取 Vertex AI

模型可用性

請注意,Anthropic 模型的可用性因地區而異。在 Vertex AI Model Garden 中搜尋「Claude」或前往 使用 Claude 3 以取得最新資訊。

API 模型 ID

模型Vertex AI API 模型 ID
Claude Sonnet 4.5claude-sonnet-4-5@20250929Copied!
Claude Sonnet 4claude-sonnet-4@20250514Copied!
Claude Sonnet 3.7 claude-3-7-sonnet@20250219Copied!
Claude Opus 4.1claude-opus-4-1@20250805Copied!
Claude Opus 4claude-opus-4@20250514Copied!
Claude Opus 3 claude-3-opus@20240229Copied!
Claude Haiku 4.5claude-haiku-4-5@20251001Copied!
Claude Haiku 3.5claude-3-5-haiku@20241022Copied!
Claude Haiku 3claude-3-haiku@20240307Copied!

發出請求

在執行請求之前,您可能需要執行 gcloud auth application-default login 以使用 GCP 進行身份驗證。 以下範例顯示如何從 Vertex AI 上的 Claude 產生文字:
from anthropic import AnthropicVertex

project_id = "MY_PROJECT_ID"
region = "global"

client = AnthropicVertex(project_id=project_id, region=region)

message = client.messages.create(
    model="claude-sonnet-4-5@20250929",
    max_tokens=100,
    messages=[
        {
            "role": "user",
            "content": "Hey Claude!",
        }
    ],
)
print(message)
如需更多詳細資訊,請參閱我們的 client SDKs 和官方 Vertex AI 文件

活動記錄

Vertex 提供 請求-回應記錄服務,允許客戶記錄與您的使用相關的提示和完成。 Anthropic 建議您至少在 30 天滾動基礎上記錄您的活動,以便瞭解您的活動並調查任何潛在的濫用。
啟用此服務不會給 Google 或 Anthropic 任何存取您內容的權限。

功能支援

您可以在 此處 找到 Vertex 上目前支援的所有功能。

全球端點與區域端點

Claude Sonnet 4.5 和所有未來模型 開始,Google Vertex AI 提供兩種端點類型:
  • 全球端點:動態路由以實現最大可用性
  • 區域端點:保證透過特定地理區域的資料路由
區域端點的定價比全球端點高 10%。
這僅適用於 Claude Sonnet 4.5 和未來的模型。較舊的模型(Claude Sonnet 4、Opus 4 及更早版本)保持其現有的定價結構。

何時使用各選項

全球端點(推薦):
  • 提供最大可用性和正常運行時間
  • 動態將請求路由到具有可用容量的區域
  • 無定價溢價
  • 最適合資料駐留靈活的應用程式
  • 僅支援按使用量付費流量(佈建的輸送量需要區域端點)
區域端點:
  • 透過特定地理區域路由流量
  • 資料駐留和合規性要求所需
  • 支援按使用量付費和佈建的輸送量
  • 10% 的定價溢價反映了專用區域容量的基礎設施成本

實施

使用全球端點(推薦): 初始化用戶端時將 region 參數設定為 "global"
from anthropic import AnthropicVertex

project_id = "MY_PROJECT_ID"
region = "global"

client = AnthropicVertex(project_id=project_id, region=region)

message = client.messages.create(
    model="claude-sonnet-4-5@20250929",
    max_tokens=100,
    messages=[
        {
            "role": "user",
            "content": "Hey Claude!",
        }
    ],
)
print(message)
使用區域端點: 指定特定區域,例如 "us-east1""europe-west1"
from anthropic import AnthropicVertex

project_id = "MY_PROJECT_ID"
region = "us-east1"  # 指定特定區域

client = AnthropicVertex(project_id=project_id, region=region)

message = client.messages.create(
    model="claude-sonnet-4-5@20250929",
    max_tokens=100,
    messages=[
        {
            "role": "user",
            "content": "Hey Claude!",
        }
    ],
)
print(message)

其他資源