先決條件
在使用 Vertex AI 設定 Claude Code 之前,請確保您具有:- 已啟用計費的 Google Cloud Platform (GCP) 帳戶
- 已啟用 Vertex AI API 的 GCP 專案
- 存取所需的 Claude 模型(例如 Claude Sonnet 4.5)
- 已安裝並設定 Google Cloud SDK (
gcloud) - 在所需的 GCP 區域中分配的配額
區域設定
Claude Code 可與 Vertex AI 全球和區域端點一起使用。Vertex AI 可能不支援所有區域上的 Claude Code 預設模型。您可能需要切換到支援的區域或模型。
Vertex AI 可能不支援全球端點上的 Claude Code 預設模型。您可能需要切換到區域端點或支援的模型。
設定
1. 啟用 Vertex AI API
在您的 GCP 專案中啟用 Vertex AI API:2. 要求模型存取
要求在 Vertex AI 中存取 Claude 模型:- 導覽至 Vertex AI Model Garden
- 搜尋「Claude」模型
- 要求存取所需的 Claude 模型(例如 Claude Sonnet 4.5)
- 等待核准(可能需要 24-48 小時)
3. 設定 GCP 認證
Claude Code 使用標準 Google Cloud 驗證。 如需詳細資訊,請參閱 Google Cloud 驗證文件。進行驗證時,Claude Code 將自動使用來自
ANTHROPIC_VERTEX_PROJECT_ID 環境變數的專案 ID。若要覆寫此設定,請設定以下其中一個環境變數:GCLOUD_PROJECT、GOOGLE_CLOUD_PROJECT 或 GOOGLE_APPLICATION_CREDENTIALS。4. 設定 Claude Code
設定下列環境變數:當您指定
cache_control 暫時旗標時,提示快取會自動支援。若要停用它,請設定 DISABLE_PROMPT_CACHING=1。如需提高速率限制,請聯絡 Google Cloud 支援。使用 Vertex AI 時,
/login 和 /logout 命令已停用,因為驗證是透過 Google Cloud 認證處理的。5. 模型設定
Claude Code 為 Vertex AI 使用這些預設模型:| 模型類型 | 預設值 |
|---|---|
| 主要模型 | claude-sonnet-4-5@20250929 |
| 小型/快速模型 | claude-haiku-4-5@20251001 |
對於 Vertex AI 使用者,Claude Code 不會自動從 Haiku 3.5 升級到 Haiku 4.5。若要手動切換到較新的 Haiku 模型,請將
ANTHROPIC_DEFAULT_HAIKU_MODEL 環境變數設定為完整模型名稱(例如 claude-haiku-4-5@20251001)。IAM 設定
指派必要的 IAM 權限:roles/aiplatform.user 角色包含必要的權限:
aiplatform.endpoints.predict- 模型呼叫和權杖計數所需
我們建議為 Claude Code 建立專用的 GCP 專案,以簡化成本追蹤和存取控制。
1M 權杖內容視窗
Claude Sonnet 4 和 Sonnet 4.5 在 Vertex AI 上支援 1M 權杖內容視窗。1M 權杖內容視窗目前處於測試版。若要使用擴展內容視窗,請在您的 Vertex AI 要求中包含
context-1m-2025-08-07 測試版標頭。故障排除
如果您遇到配額問題:- 透過 Cloud Console 檢查目前配額或要求增加配額
- 確認模型在 Model Garden 中已啟用
- 驗證您有權存取指定的區域
- 如果使用
CLOUD_ML_REGION=global,請檢查您的模型是否在 Model Garden 中的「支援的功能」下支援全球端點。對於不支援全球端點的模型,請執行下列其中一項:- 透過
ANTHROPIC_MODEL或ANTHROPIC_SMALL_FAST_MODEL指定支援的模型,或 - 使用
VERTEX_REGION_<MODEL_NAME>環境變數設定區域端點
- 透過
- 對於區域端點,請確保主要模型和小型/快速模型在您選定的區域中受支援
- 考慮切換到
CLOUD_ML_REGION=global以獲得更好的可用性