前提条件

Vertex AIでClaude Codeを設定する前に、以下を確認してください:

  • 請求が有効になっているGoogle Cloud Platform(GCP)アカウント
  • Vertex AI APIが有効になっているGCPプロジェクト
  • 希望するClaudeモデルへのアクセス(例:Claude Sonnet 4)
  • Google Cloud SDK(gcloud)がインストールされ設定されていること
  • 希望するGCPリージョンでクォータが割り当てられていること

リージョン設定

Claude CodeはVertex AIのグローバルエンドポイントとリージョナルエンドポイントの両方で使用できます。

Vertex AIはすべてのリージョンでClaude Codeのデフォルトモデルをサポートしていない場合があります。サポートされているリージョンまたはモデルに切り替える必要がある場合があります。

Vertex AIはグローバルエンドポイントでClaude Codeのデフォルトモデルをサポートしていない場合があります。リージョナルエンドポイントまたはサポートされているモデルに切り替える必要がある場合があります。

セットアップ

1. Vertex AI APIを有効にする

GCPプロジェクトでVertex AI APIを有効にします:

# プロジェクトIDを設定
gcloud config set project YOUR-PROJECT-ID

# Vertex AI APIを有効にする
gcloud services enable aiplatform.googleapis.com

2. モデルアクセスをリクエストする

Vertex AIでClaudeモデルへのアクセスをリクエストします:

  1. Vertex AI Model Gardenに移動
  2. 「Claude」モデルを検索
  3. 希望するClaudeモデル(例:Claude Sonnet 4)へのアクセスをリクエスト
  4. 承認を待つ(24-48時間かかる場合があります)

3. GCP認証情報を設定する

Claude Codeは標準のGoogle Cloud認証を使用します。

詳細については、Google Cloud認証ドキュメントを参照してください。

認証時、Claude CodeはANTHROPIC_VERTEX_PROJECT_ID環境変数からプロジェクトIDを自動的に使用します。これを上書きするには、次の環境変数のいずれかを設定してください:GCLOUD_PROJECTGOOGLE_CLOUD_PROJECT、またはGOOGLE_APPLICATION_CREDENTIALS

4. Claude Codeを設定する

以下の環境変数を設定します:

# Vertex AI統合を有効にする
export CLAUDE_CODE_USE_VERTEX=1
export CLOUD_ML_REGION=global
export ANTHROPIC_VERTEX_PROJECT_ID=YOUR-PROJECT-ID

# オプション:必要に応じてプロンプトキャッシュを無効にする
export DISABLE_PROMPT_CACHING=1

# CLOUD_ML_REGION=globalの場合、サポートされていないモデルのリージョンを上書き
export VERTEX_REGION_CLAUDE_3_5_HAIKU=us-east5

# オプション:他の特定のモデルのリージョンを上書き
export VERTEX_REGION_CLAUDE_3_5_SONNET=us-east5
export VERTEX_REGION_CLAUDE_3_7_SONNET=us-east5
export VERTEX_REGION_CLAUDE_4_0_OPUS=europe-west1
export VERTEX_REGION_CLAUDE_4_0_SONNET=us-east5
export VERTEX_REGION_CLAUDE_4_1_OPUS=europe-west1

プロンプトキャッシュは、cache_controlエフェメラルフラグを指定すると自動的にサポートされます。無効にするには、DISABLE_PROMPT_CACHING=1を設定してください。レート制限の向上については、Google Cloudサポートにお問い合わせください。

Vertex AIを使用する場合、認証はGoogle Cloud認証情報を通じて処理されるため、/loginおよび/logoutコマンドは無効になります。

5. モデル設定

Claude CodeはVertex AIに対してこれらのデフォルトモデルを使用します:

モデルタイプデフォルト値
プライマリモデルclaude-sonnet-4@20250514
小型/高速モデルclaude-3-5-haiku@20241022

モデルをカスタマイズするには:

export ANTHROPIC_MODEL='claude-opus-4-1@20250805'
export ANTHROPIC_SMALL_FAST_MODEL='claude-3-5-haiku@20241022'

IAM設定

必要なIAM権限を割り当てます:

roles/aiplatform.userロールには必要な権限が含まれています:

  • aiplatform.endpoints.predict - モデル呼び出しに必要
  • aiplatform.endpoints.computeTokens - トークンカウントに必要

より制限的な権限については、上記の権限のみを持つカスタムロールを作成してください。

詳細については、Vertex IAMドキュメントを参照してください。

コスト追跡とアクセス制御を簡素化するために、Claude Code専用のGCPプロジェクトを作成することをお勧めします。

1Mトークンコンテキストウィンドウ

Claude Sonnet 4はVertex AIで1Mトークンコンテキストウィンドウをサポートしています。

1Mトークンコンテキストウィンドウは現在ベータ版です。拡張コンテキストウィンドウを使用するには、Vertex AIリクエストにcontext-1m-2025-08-07ベータヘッダーを含めてください。

トラブルシューティング

クォータの問題が発生した場合:

  • Cloud Consoleを通じて現在のクォータを確認するか、クォータ増加をリクエストしてください

「model not found」404エラーが発生した場合:

  • Model Gardenでモデルが有効になっていることを確認
  • 指定されたリージョンへのアクセス権があることを確認
  • CLOUD_ML_REGION=globalを使用している場合、Model Gardenの「サポートされている機能」でモデルがグローバルエンドポイントをサポートしていることを確認してください。グローバルエンドポイントをサポートしていないモデルの場合、以下のいずれかを行ってください:
    • ANTHROPIC_MODELまたはANTHROPIC_SMALL_FAST_MODELを介してサポートされているモデルを指定する、または
    • VERTEX_REGION_<MODEL_NAME>環境変数を使用してリージョナルエンドポイントを設定する

429エラーが発生した場合:

  • リージョナルエンドポイントの場合、プライマリモデルと小型/高速モデルが選択したリージョンでサポートされていることを確認
  • より良い可用性のためにCLOUD_ML_REGION=globalへの切り替えを検討してください

追加リソース