- In Vertex wird
modelnicht im Request-Body übergeben. Stattdessen wird es in der Google Cloud Endpoint-URL angegeben. - In Vertex wird
anthropic_versionim Request-Body übergeben (nicht als Header), und muss auf den Wertvertex-2023-10-16gesetzt werden.
Installieren Sie ein SDK für den Zugriff auf Vertex AI
Installieren Sie zunächst das Client SDK von Anthropic für Ihre Sprache.Zugriff auf Vertex AI
Modellverfügbarkeit
Beachten Sie, dass die Verfügbarkeit von Anthropic-Modellen je nach Region unterschiedlich ist. Suchen Sie nach “Claude” im Vertex AI Model Garden oder gehen Sie zu Claude 3 verwenden für die neuesten Informationen.API-Modell-IDs
| Modell | Vertex AI API-Modell-ID |
|---|---|
| Claude Sonnet 4.5 | claude-sonnet-4-5@20250929Copied! |
| Claude Sonnet 4 | claude-sonnet-4@20250514Copied! |
| Claude Sonnet 3.7 | claude-3-7-sonnet@20250219Copied! |
| Claude Opus 4.1 | claude-opus-4-1@20250805Copied! |
| Claude Opus 4 | claude-opus-4@20250514Copied! |
| Claude Opus 3 | claude-3-opus@20240229Copied! |
| Claude Haiku 4.5 | claude-haiku-4-5@20251001Copied! |
| Claude Haiku 3.5 | claude-3-5-haiku@20241022Copied! |
| Claude Haiku 3 | claude-3-haiku@20240307Copied! |
Anfragen stellen
Bevor Sie Anfragen ausführen, müssen Sie möglicherweisegcloud auth application-default login ausführen, um sich bei GCP zu authentifizieren.
Das folgende Beispiel zeigt, wie Sie Text von Claude auf Vertex AI generieren:
Aktivitätsprotokollierung
Vertex bietet einen Request-Response-Protokollierungsdienst, mit dem Kunden die Eingabeaufforderungen und Vervollständigungen protokollieren können, die mit Ihrer Nutzung verbunden sind. Anthropic empfiehlt, dass Sie Ihre Aktivität mindestens auf einer 30-Tage-Rollbasis protokollieren, um Ihre Aktivität zu verstehen und mögliche Missbräuche zu untersuchen.Das Aktivieren dieses Dienstes gibt Google oder Anthropic keinen Zugriff auf Ihre Inhalte.
Funktionsunterstützung
Sie können alle derzeit auf Vertex unterstützten Funktionen hier finden.Globale vs. regionale Endpoints
Ab Claude Sonnet 4.5 und allen zukünftigen Modellen bietet Google Vertex AI zwei Endpoint-Typen:- Globale Endpoints: Dynamisches Routing für maximale Verfügbarkeit
- Regionale Endpoints: Garantiertes Daten-Routing durch spezifische geografische Regionen
Dies gilt nur für Claude Sonnet 4.5 und zukünftige Modelle. Ältere Modelle (Claude Sonnet 4, Opus 4 und früher) behalten ihre bestehenden Preisstrukturen bei.
Wann sollte man jede Option verwenden
Globale Endpoints (empfohlen):- Bieten maximale Verfügbarkeit und Betriebszeit
- Leiten Anfragen dynamisch an Regionen mit verfügbarer Kapazität weiter
- Kein Preisaufschlag
- Beste für Anwendungen, bei denen Datenresidenz flexibel ist
- Unterstützt nur Pay-as-you-go-Verkehr (bereitgestellter Durchsatz erfordert regionale Endpoints)
- Leiten Verkehr durch spezifische geografische Regionen weiter
- Erforderlich für Datenresidenz und Compliance-Anforderungen
- Unterstützen sowohl Pay-as-you-go als auch bereitgestellten Durchsatz
- 10%-Preisaufschlag spiegelt Infrastrukturkosten für dedizierte regionale Kapazität wider
Implementierung
Verwendung globaler Endpoints (empfohlen): Setzen Sie den Parameterregion auf "global" beim Initialisieren des Clients:
"us-east1" oder "europe-west1" an:
Zusätzliche Ressourcen
- Google Vertex AI-Preise: cloud.google.com/vertex-ai/generative-ai/pricing
- Claude-Modelle-Dokumentation: Claude auf Vertex AI
- Google-Blogbeitrag: Globaler Endpoint für Claude-Modelle
- Anthropic-Preisdetails: Preisdokumentation