Claude Code auf Google Vertex AI

Voraussetzungen

Bevor Sie Claude Code mit Vertex AI konfigurieren, stellen Sie sicher, dass Sie Folgendes haben:

Ein Google Cloud Platform (GCP) Konto mit aktivierter Abrechnung
Ein GCP-Projekt mit aktivierter Vertex AI API
Zugang zu gewünschten Claude-Modellen (z.B. Claude Sonnet 4.5)
Google Cloud SDK (gcloud) installiert und konfiguriert
Kontingent in der gewünschten GCP-Region zugewiesen

Regionskonfiguration

Claude Code kann sowohl mit Vertex AI globalen als auch regionalen Endpunkten verwendet werden.

Vertex AI unterstützt möglicherweise nicht die Claude Code Standard-Modelle in allen Regionen. Sie müssen möglicherweise zu einer unterstützten Region oder einem unterstützten Modell wechseln.

Vertex AI unterstützt möglicherweise nicht die Claude Code Standard-Modelle auf globalen Endpunkten. Sie müssen möglicherweise zu einem regionalen Endpunkt oder einem unterstützten Modell wechseln.

Setup

1. Vertex AI API aktivieren

Aktivieren Sie die Vertex AI API in Ihrem GCP-Projekt:

# Setzen Sie Ihre Projekt-ID
gcloud config set project YOUR-PROJECT-ID

# Vertex AI API aktivieren
gcloud services enable aiplatform.googleapis.com

2. Modellzugang anfordern

Fordern Sie Zugang zu Claude-Modellen in Vertex AI an:

Navigieren Sie zum Vertex AI Model Garden
Suchen Sie nach “Claude”-Modellen
Fordern Sie Zugang zu gewünschten Claude-Modellen an (z.B. Claude Sonnet 4.5)
Warten Sie auf die Genehmigung (kann 24-48 Stunden dauern)

3. GCP-Anmeldedaten konfigurieren

Claude Code verwendet die Standard-Google Cloud-Authentifizierung. Weitere Informationen finden Sie in der Google Cloud-Authentifizierungsdokumentation.

Bei der Authentifizierung verwendet Claude Code automatisch die Projekt-ID aus der Umgebungsvariable ANTHROPIC_VERTEX_PROJECT_ID. Um dies zu überschreiben, setzen Sie eine dieser Umgebungsvariablen: GCLOUD_PROJECT, GOOGLE_CLOUD_PROJECT oder GOOGLE_APPLICATION_CREDENTIALS.

4. Claude Code konfigurieren

Setzen Sie die folgenden Umgebungsvariablen:

# Vertex AI Integration aktivieren
export CLAUDE_CODE_USE_VERTEX=1
export CLOUD_ML_REGION=global
export ANTHROPIC_VERTEX_PROJECT_ID=YOUR-PROJECT-ID

# Optional: Prompt-Caching deaktivieren falls erforderlich
export DISABLE_PROMPT_CACHING=1

# Wenn CLOUD_ML_REGION=global, Region für nicht unterstützte Modelle überschreiben
export VERTEX_REGION_CLAUDE_3_5_HAIKU=us-east5

# Optional: Regionen für andere spezifische Modelle überschreiben
export VERTEX_REGION_CLAUDE_3_5_SONNET=us-east5
export VERTEX_REGION_CLAUDE_3_7_SONNET=us-east5
export VERTEX_REGION_CLAUDE_4_0_OPUS=europe-west1
export VERTEX_REGION_CLAUDE_4_0_SONNET=us-east5
export VERTEX_REGION_CLAUDE_4_1_OPUS=europe-west1

Prompt-Caching wird automatisch unterstützt, wenn Sie das cache_control ephemeral Flag angeben. Um es zu deaktivieren, setzen Sie DISABLE_PROMPT_CACHING=1. Für erhöhte Rate-Limits wenden Sie sich an den Google Cloud Support.

Bei der Verwendung von Vertex AI sind die /login und /logout Befehle deaktiviert, da die Authentifizierung über Google Cloud-Anmeldedaten abgewickelt wird.

5. Modellkonfiguration

Claude Code verwendet diese Standard-Modelle für Vertex AI:

Modelltyp	Standardwert
Primäres Modell	`claude-sonnet-4-5@20250929`
Kleines/schnelles Modell	`claude-haiku-4-5@20251001`

Für Vertex AI-Benutzer wird Claude Code nicht automatisch von Haiku 3.5 auf Haiku 4.5 aktualisieren. Um manuell zu einem neueren Haiku-Modell zu wechseln, setzen Sie die Umgebungsvariable ANTHROPIC_DEFAULT_HAIKU_MODEL auf den vollständigen Modellnamen (z.B. claude-haiku-4-5@20251001).

Um Modelle anzupassen:

export ANTHROPIC_MODEL='claude-opus-4-1@20250805'
export ANTHROPIC_SMALL_FAST_MODEL='claude-haiku-4-5@20251001'

IAM-Konfiguration

Weisen Sie die erforderlichen IAM-Berechtigungen zu: Die Rolle roles/aiplatform.user enthält die erforderlichen Berechtigungen:

aiplatform.endpoints.predict - Erforderlich für Modellaufruf
aiplatform.endpoints.computeTokens - Erforderlich für Token-Zählung

Für restriktivere Berechtigungen erstellen Sie eine benutzerdefinierte Rolle mit nur den oben genannten Berechtigungen. Weitere Details finden Sie in der Vertex IAM-Dokumentation.

Wir empfehlen, ein dediziertes GCP-Projekt für Claude Code zu erstellen, um die Kostenverfolgung und Zugriffskontrolle zu vereinfachen.

1M Token-Kontextfenster

Claude Sonnet 4 und Sonnet 4.5 unterstützen das 1M Token-Kontextfenster auf Vertex AI.

Das 1M Token-Kontextfenster befindet sich derzeit in der Beta-Phase. Um das erweiterte Kontextfenster zu verwenden, fügen Sie den context-1m-2025-08-07 Beta-Header in Ihre Vertex AI-Anfragen ein.

Fehlerbehebung

Wenn Sie Kontingent-Probleme haben:

Überprüfen Sie aktuelle Kontingente oder fordern Sie eine Kontingent-Erhöhung über die Cloud Console an

Wenn Sie “Modell nicht gefunden” 404-Fehler haben:

Bestätigen Sie, dass das Modell im Model Garden aktiviert ist
Überprüfen Sie, ob Sie Zugang zur angegebenen Region haben
Wenn Sie CLOUD_ML_REGION=global verwenden, überprüfen Sie, ob Ihre Modelle globale Endpunkte im Model Garden unter “Unterstützte Funktionen” unterstützen. Für Modelle, die keine globalen Endpunkte unterstützen, entweder:
- Geben Sie ein unterstütztes Modell über ANTHROPIC_MODEL oder ANTHROPIC_SMALL_FAST_MODEL an, oder
- Setzen Sie einen regionalen Endpunkt mit VERTEX_REGION_<MODEL_NAME> Umgebungsvariablen

Wenn Sie 429-Fehler haben:

Für regionale Endpunkte stellen Sie sicher, dass das primäre Modell und das kleine/schnelle Modell in Ihrer ausgewählten Region unterstützt werden
Erwägen Sie den Wechsel zu CLOUD_ML_REGION=global für bessere Verfügbarkeit

Erste Schritte

Mit Claude Code entwickeln

Claude Agent SDK

Bereitstellung

Verwaltung

Konfiguration

Referenz

Ressourcen

Claude Code auf Google Vertex AI

Voraussetzungen

Regionskonfiguration

Setup

1. Vertex AI API aktivieren

2. Modellzugang anfordern

3. GCP-Anmeldedaten konfigurieren

4. Claude Code konfigurieren

5. Modellkonfiguration

IAM-Konfiguration

1M Token-Kontextfenster

Fehlerbehebung

Zusätzliche Ressourcen

Erste Schritte

Mit Claude Code entwickeln

Claude Agent SDK

Bereitstellung

Verwaltung

Konfiguration

Referenz

Ressourcen

​Voraussetzungen

​Regionskonfiguration

​Setup

​1. Vertex AI API aktivieren

​2. Modellzugang anfordern

​3. GCP-Anmeldedaten konfigurieren

​4. Claude Code konfigurieren

​5. Modellkonfiguration

​IAM-Konfiguration

​1M Token-Kontextfenster

​Fehlerbehebung

​Zusätzliche Ressourcen

Voraussetzungen

Regionskonfiguration

Setup

1. Vertex AI API aktivieren

2. Modellzugang anfordern

3. GCP-Anmeldedaten konfigurieren

4. Claude Code konfigurieren

5. Modellkonfiguration

IAM-Konfiguration

1M Token-Kontextfenster

Fehlerbehebung

Zusätzliche Ressourcen