前提条件
Claude CodeをVertex AIで設定する前に、以下を確認してください:- 請求が有効になっているGoogle Cloud Platform(GCP)アカウント
- Vertex AI APIが有効になっているGCPプロジェクト
- 目的のClaudeモデルへのアクセス(例:Claude Sonnet 4.5)
- Google Cloud SDK(
gcloud)がインストールおよび設定されていること - 目的のGCPリージョンに割り当てられたクォータ
リージョン設定
Claude CodeはVertex AI グローバルエンドポイントと地域別エンドポイントの両方で使用できます。Vertex AIは、すべてのリージョンでClaude Codeのデフォルトモデルをサポートしていない場合があります。サポートされているリージョンまたはモデルに切り替える必要がある場合があります。
Vertex AIは、グローバルエンドポイント上のClaude Codeのデフォルトモデルをサポートしていない場合があります。地域別エンドポイントまたはサポートされているモデルに切り替える必要がある場合があります。
セットアップ
1. Vertex AI APIを有効にする
GCPプロジェクトでVertex AI APIを有効にします:2. モデルアクセスをリクエストする
Vertex AIでClaudeモデルへのアクセスをリクエストします:- Vertex AI Model Gardenに移動します
- 「Claude」モデルを検索します
- 目的のClaudeモデルへのアクセスをリクエストします(例:Claude Sonnet 4.5)
- 承認を待ちます(24~48時間かかる場合があります)
3. GCP認証情報を設定する
Claude Codeは標準的なGoogle Cloud認証を使用します。 詳細については、Google Cloud認証ドキュメントを参照してください。認証時に、Claude Codeは
ANTHROPIC_VERTEX_PROJECT_ID環境変数からプロジェクトIDを自動的に使用します。これをオーバーライドするには、次の環境変数のいずれかを設定します:GCLOUD_PROJECT、GOOGLE_CLOUD_PROJECT、またはGOOGLE_APPLICATION_CREDENTIALS。4. Claude Codeを設定する
次の環境変数を設定します:プロンプトキャッシングは、
cache_controlエフェメラルフラグを指定すると自動的にサポートされます。これを無効にするには、DISABLE_PROMPT_CACHING=1を設定します。レート制限を高くするには、Google Cloudサポートにお問い合わせください。Vertex AIを使用する場合、Google Cloud認証情報を通じて認証が処理されるため、
/loginおよび/logoutコマンドは無効になります。5. モデル設定
Claude CodeはVertex AIに対して以下のデフォルトモデルを使用します:| モデルタイプ | デフォルト値 |
|---|---|
| プライマリモデル | claude-sonnet-4-5@20250929 |
| 小型/高速モデル | claude-haiku-4-5@20251001 |
Vertex AIユーザーの場合、Claude CodeはHaiku 3.5からHaiku 4.5に自動的にアップグレードされません。新しいHaikuモデルに手動で切り替えるには、
ANTHROPIC_DEFAULT_HAIKU_MODEL環境変数をフルモデル名に設定します(例:claude-haiku-4-5@20251001)。IAM設定
必要なIAMパーミッションを割り当てます:roles/aiplatform.userロールには必要なパーミッションが含まれています:
aiplatform.endpoints.predict- モデル呼び出しとトークンカウントに必要
コスト追跡とアクセス制御を簡素化するために、Claude Code用に専用のGCPプロジェクトを作成することをお勧めします。
1Mトークンコンテキストウィンドウ
Claude Sonnet 4およびSonnet 4.5は、Vertex AI上で1Mトークンコンテキストウィンドウをサポートしています。1Mトークンコンテキストウィンドウは現在ベータ版です。拡張コンテキストウィンドウを使用するには、Vertex AIリクエストに
context-1m-2025-08-07ベータヘッダーを含めます。トラブルシューティング
クォータの問題が発生した場合:- Cloud Consoleを通じて現在のクォータを確認するか、クォータ増加をリクエストします
- Model Gardenでモデルが有効になっていることを確認します
- 指定されたリージョンへのアクセス権があることを確認します
CLOUD_ML_REGION=globalを使用している場合、Model Gardenの「Supported features」でモデルがグローバルエンドポイントをサポートしていることを確認します。グローバルエンドポイントをサポートしていないモデルの場合は、以下のいずれかを実行します:ANTHROPIC_MODELまたはANTHROPIC_SMALL_FAST_MODELを通じてサポートされているモデルを指定するか、VERTEX_REGION_<MODEL_NAME>環境変数を使用して地域別エンドポイントを設定します
- 地域別エンドポイントの場合、プライマリモデルと小型/高速モデルが選択したリージョンでサポートされていることを確認します
- より良い可用性のために
CLOUD_ML_REGION=globalへの切り替えを検討します