Claude Code auf Google Vertex AI
Erfahren Sie mehr über die Konfiguration von Claude Code über Google Vertex AI, einschließlich Setup, IAM-Konfiguration und Fehlerbehebung.
Voraussetzungen
Bevor Sie Claude Code mit Vertex AI konfigurieren, stellen Sie sicher, dass Sie Folgendes haben:
- Ein Google Cloud Platform (GCP) Konto mit aktivierter Abrechnung
- Ein GCP-Projekt mit aktivierter Vertex AI API
- Zugang zu gewünschten Claude-Modellen (z.B. Claude Sonnet 4)
- Google Cloud SDK (
gcloud
) installiert und konfiguriert - Kontingent in der gewünschten GCP-Region zugewiesen
Regionskonfiguration
Claude Code kann sowohl mit Vertex AI globalen als auch regionalen Endpunkten verwendet werden.
Vertex AI unterstützt möglicherweise nicht die Claude Code Standard-Modelle in allen Regionen. Sie müssen möglicherweise zu einer unterstützten Region oder einem unterstützten Modell wechseln.
Vertex AI unterstützt möglicherweise nicht die Claude Code Standard-Modelle auf globalen Endpunkten. Sie müssen möglicherweise zu einem regionalen Endpunkt oder einem unterstützten Modell wechseln.
Setup
1. Vertex AI API aktivieren
Aktivieren Sie die Vertex AI API in Ihrem GCP-Projekt:
2. Modellzugang anfordern
Fordern Sie Zugang zu Claude-Modellen in Vertex AI an:
- Navigieren Sie zum Vertex AI Model Garden
- Suchen Sie nach “Claude”-Modellen
- Fordern Sie Zugang zu gewünschten Claude-Modellen an (z.B. Claude Sonnet 4)
- Warten Sie auf die Genehmigung (kann 24-48 Stunden dauern)
3. GCP-Anmeldedaten konfigurieren
Claude Code verwendet die Standard-Google Cloud-Authentifizierung.
Weitere Informationen finden Sie in der Google Cloud-Authentifizierungsdokumentation.
Bei der Authentifizierung verwendet Claude Code automatisch die Projekt-ID aus der Umgebungsvariable ANTHROPIC_VERTEX_PROJECT_ID
. Um dies zu überschreiben, setzen Sie eine dieser Umgebungsvariablen: GCLOUD_PROJECT
, GOOGLE_CLOUD_PROJECT
oder GOOGLE_APPLICATION_CREDENTIALS
.
4. Claude Code konfigurieren
Setzen Sie die folgenden Umgebungsvariablen:
Prompt-Caching wird automatisch unterstützt, wenn Sie das cache_control
ephemeral Flag angeben. Um es zu deaktivieren, setzen Sie DISABLE_PROMPT_CACHING=1
. Für erhöhte Rate-Limits wenden Sie sich an den Google Cloud Support.
Bei der Verwendung von Vertex AI sind die /login
und /logout
Befehle deaktiviert, da die Authentifizierung über Google Cloud-Anmeldedaten abgewickelt wird.
5. Modellkonfiguration
Claude Code verwendet diese Standard-Modelle für Vertex AI:
Modelltyp | Standardwert |
---|---|
Primäres Modell | claude-sonnet-4@20250514 |
Kleines/schnelles Modell | claude-3-5-haiku@20241022 |
Um Modelle anzupassen:
IAM-Konfiguration
Weisen Sie die erforderlichen IAM-Berechtigungen zu:
Die Rolle roles/aiplatform.user
umfasst die erforderlichen Berechtigungen:
aiplatform.endpoints.predict
- Erforderlich für Modellaufrufaiplatform.endpoints.computeTokens
- Erforderlich für Token-Zählung
Für restriktivere Berechtigungen erstellen Sie eine benutzerdefinierte Rolle mit nur den oben genannten Berechtigungen.
Details finden Sie in der Vertex IAM-Dokumentation.
Wir empfehlen, ein dediziertes GCP-Projekt für Claude Code zu erstellen, um die Kostenverfolgung und Zugriffskontrolle zu vereinfachen.
1M Token Kontextfenster
Claude Sonnet 4 unterstützt das 1M Token Kontextfenster auf Vertex AI.
Das 1M Token Kontextfenster befindet sich derzeit in der Beta-Phase. Um das erweiterte Kontextfenster zu verwenden, fügen Sie den context-1m-2025-08-07
Beta-Header in Ihre Vertex AI-Anfragen ein.
Fehlerbehebung
Wenn Sie Kontingentprobleme haben:
- Überprüfen Sie aktuelle Kontingente oder fordern Sie eine Kontingenterhöhung über die Cloud Console an
Wenn Sie “model not found” 404-Fehler haben:
- Bestätigen Sie, dass das Modell im Model Garden aktiviert ist
- Überprüfen Sie, ob Sie Zugang zur angegebenen Region haben
- Wenn Sie
CLOUD_ML_REGION=global
verwenden, überprüfen Sie, ob Ihre Modelle globale Endpunkte im Model Garden unter “Unterstützte Funktionen” unterstützen. Für Modelle, die keine globalen Endpunkte unterstützen, entweder:- Geben Sie ein unterstütztes Modell über
ANTHROPIC_MODEL
oderANTHROPIC_SMALL_FAST_MODEL
an, oder - Setzen Sie einen regionalen Endpunkt mit
VERTEX_REGION_<MODEL_NAME>
Umgebungsvariablen
- Geben Sie ein unterstütztes Modell über
Wenn Sie 429-Fehler haben:
- Für regionale Endpunkte stellen Sie sicher, dass das primäre Modell und das kleine/schnelle Modell in Ihrer ausgewählten Region unterstützt werden
- Erwägen Sie den Wechsel zu
CLOUD_ML_REGION=global
für bessere Verfügbarkeit