Google Vertex AI上のClaude Code
Google Vertex AIを通じたClaude Codeの設定について、セットアップ、IAM設定、トラブルシューティングを含めて学習します。
前提条件
Vertex AIでClaude Codeを設定する前に、以下を確認してください:
- 請求が有効になっているGoogle Cloud Platform(GCP)アカウント
- Vertex AI APIが有効になっているGCPプロジェクト
- 希望するClaudeモデルへのアクセス(例:Claude Sonnet 4)
- Google Cloud SDK(
gcloud
)がインストールされ設定されていること - 希望するGCPリージョンでクォータが割り当てられていること
リージョン設定
Claude CodeはVertex AIのグローバルエンドポイントとリージョナルエンドポイントの両方で使用できます。
Vertex AIはすべてのリージョンでClaude Codeのデフォルトモデルをサポートしていない場合があります。サポートされているリージョンまたはモデルに切り替える必要がある場合があります。
Vertex AIはグローバルエンドポイントでClaude Codeのデフォルトモデルをサポートしていない場合があります。リージョナルエンドポイントまたはサポートされているモデルに切り替える必要がある場合があります。
セットアップ
1. Vertex AI APIを有効にする
GCPプロジェクトでVertex AI APIを有効にします:
2. モデルアクセスをリクエストする
Vertex AIでClaudeモデルへのアクセスをリクエストします:
- Vertex AI Model Gardenに移動
- 「Claude」モデルを検索
- 希望するClaudeモデル(例:Claude Sonnet 4)へのアクセスをリクエスト
- 承認を待つ(24-48時間かかる場合があります)
3. GCP認証情報を設定する
Claude Codeは標準のGoogle Cloud認証を使用します。
詳細については、Google Cloud認証ドキュメントを参照してください。
認証時、Claude CodeはANTHROPIC_VERTEX_PROJECT_ID
環境変数からプロジェクトIDを自動的に使用します。これを上書きするには、次の環境変数のいずれかを設定してください:GCLOUD_PROJECT
、GOOGLE_CLOUD_PROJECT
、またはGOOGLE_APPLICATION_CREDENTIALS
。
4. Claude Codeを設定する
以下の環境変数を設定します:
プロンプトキャッシュは、cache_control
エフェメラルフラグを指定すると自動的にサポートされます。無効にするには、DISABLE_PROMPT_CACHING=1
を設定してください。レート制限の向上については、Google Cloudサポートにお問い合わせください。
Vertex AIを使用する場合、認証はGoogle Cloud認証情報を通じて処理されるため、/login
および/logout
コマンドは無効になります。
5. モデル設定
Claude CodeはVertex AIに対してこれらのデフォルトモデルを使用します:
モデルタイプ | デフォルト値 |
---|---|
プライマリモデル | claude-sonnet-4@20250514 |
小型/高速モデル | claude-3-5-haiku@20241022 |
モデルをカスタマイズするには:
IAM設定
必要なIAM権限を割り当てます:
roles/aiplatform.user
ロールには必要な権限が含まれています:
aiplatform.endpoints.predict
- モデル呼び出しに必要aiplatform.endpoints.computeTokens
- トークンカウントに必要
より制限的な権限については、上記の権限のみを持つカスタムロールを作成してください。
詳細については、Vertex IAMドキュメントを参照してください。
コスト追跡とアクセス制御を簡素化するために、Claude Code専用のGCPプロジェクトを作成することをお勧めします。
1Mトークンコンテキストウィンドウ
Claude Sonnet 4はVertex AIで1Mトークンコンテキストウィンドウをサポートしています。
1Mトークンコンテキストウィンドウは現在ベータ版です。拡張コンテキストウィンドウを使用するには、Vertex AIリクエストにcontext-1m-2025-08-07
ベータヘッダーを含めてください。
トラブルシューティング
クォータの問題が発生した場合:
- Cloud Consoleを通じて現在のクォータを確認するか、クォータ増加をリクエストしてください
「model not found」404エラーが発生した場合:
- Model Gardenでモデルが有効になっていることを確認
- 指定されたリージョンへのアクセス権があることを確認
CLOUD_ML_REGION=global
を使用している場合、Model Gardenの「サポートされている機能」でモデルがグローバルエンドポイントをサポートしていることを確認してください。グローバルエンドポイントをサポートしていないモデルの場合、以下のいずれかを行ってください:ANTHROPIC_MODEL
またはANTHROPIC_SMALL_FAST_MODEL
を介してサポートされているモデルを指定する、またはVERTEX_REGION_<MODEL_NAME>
環境変数を使用してリージョナルエンドポイントを設定する
429エラーが発生した場合:
- リージョナルエンドポイントの場合、プライマリモデルと小型/高速モデルが選択したリージョンでサポートされていることを確認
- より良い可用性のために
CLOUD_ML_REGION=global
への切り替えを検討してください