- Dans Vertex,
modeln’est pas transmis dans le corps de la requête. Au lieu de cela, il est spécifié dans l’URL du point de terminaison Google Cloud. - Dans Vertex,
anthropic_versionest transmis dans le corps de la requête (plutôt que comme en-tête), et doit être défini sur la valeurvertex-2023-10-16.
Installer un SDK pour accéder à Vertex AI
Tout d’abord, installez le SDK client d’Anthropic pour le langage de votre choix.Accéder à Vertex AI
Disponibilité des modèles
Notez que la disponibilité des modèles Anthropic varie selon la région. Recherchez « Claude » dans le Vertex AI Model Garden ou allez à Utiliser Claude 3 pour les dernières informations.ID de modèle API
| Modèle | ID de modèle API Vertex AI |
|---|---|
| Claude Sonnet 4.5 | claude-sonnet-4-5@20250929Copied! |
| Claude Sonnet 4 | claude-sonnet-4@20250514Copied! |
| Claude Sonnet 3.7 | claude-3-7-sonnet@20250219Copied! |
| Claude Opus 4.1 | claude-opus-4-1@20250805Copied! |
| Claude Opus 4 | claude-opus-4@20250514Copied! |
| Claude Opus 3 | claude-3-opus@20240229Copied! |
| Claude Haiku 4.5 | claude-haiku-4-5@20251001Copied! |
| Claude Haiku 3.5 | claude-3-5-haiku@20241022Copied! |
| Claude Haiku 3 | claude-3-haiku@20240307Copied! |
Effectuer des requêtes
Avant d’exécuter les requêtes, vous devrez peut-être exécutergcloud auth application-default login pour vous authentifier auprès de GCP.
L’exemple suivant montre comment générer du texte à partir de Claude sur Vertex AI :
Journalisation des activités
Vertex fournit un service de journalisation des requêtes-réponses qui permet aux clients de journaliser les invites et les complétions associées à votre utilisation. Anthropic recommande que vous journalisiez votre activité sur au moins une base glissante de 30 jours afin de comprendre votre activité et d’enquêter sur tout abus potentiel.L’activation de ce service ne donne à Google ou à Anthropic aucun accès à votre contenu.
Support des fonctionnalités
Vous pouvez trouver toutes les fonctionnalités actuellement supportées sur Vertex ici.Points de terminaison mondiaux par rapport aux points de terminaison régionaux
À partir de Claude Sonnet 4.5 et tous les modèles futurs, Google Vertex AI offre deux types de points de terminaison :- Points de terminaison mondiaux : Routage dynamique pour une disponibilité maximale
- Points de terminaison régionaux : Routage des données garanti via des régions géographiques spécifiques
Ceci s’applique à Claude Sonnet 4.5 et aux modèles futurs uniquement. Les modèles plus anciens (Claude Sonnet 4, Opus 4 et antérieurs) conservent leurs structures tarifaires existantes.
Quand utiliser chaque option
Points de terminaison mondiaux (recommandé) :- Fournissent une disponibilité et un temps de fonctionnement maximaux
- Acheminent dynamiquement les requêtes vers les régions disposant de capacité disponible
- Aucune prime tarifaire
- Idéal pour les applications où la résidence des données est flexible
- Supporte uniquement le trafic à l’usage (le débit provisionné nécessite des points de terminaison régionaux)
- Acheminent le trafic via des régions géographiques spécifiques
- Requis pour les exigences de résidence des données et de conformité
- Supportent à la fois le trafic à l’usage et le débit provisionné
- La prime tarifaire de 10 % reflète les coûts d’infrastructure pour la capacité régionale dédiée
Implémentation
Utilisation des points de terminaison mondiaux (recommandé) : Définissez le paramètreregion sur "global" lors de l’initialisation du client :
"us-east1" ou "europe-west1" :
Ressources supplémentaires
- Tarification Google Vertex AI : cloud.google.com/vertex-ai/generative-ai/pricing
- Documentation des modèles Claude : Claude sur Vertex AI
- Article de blog Google : Point de terminaison mondial pour les modèles Claude
- Détails de tarification Anthropic : Documentation de tarification