- In Vertex,
modelnon viene passato nel corpo della richiesta. Invece, viene specificato nell’URL dell’endpoint di Google Cloud. - In Vertex,
anthropic_versionviene passato nel corpo della richiesta (piuttosto che come intestazione) e deve essere impostato al valorevertex-2023-10-16.
Installa un SDK per accedere a Vertex AI
Per prima cosa, installa l’SDK client di Anthropic per il linguaggio di tua scelta.Accesso a Vertex AI
Disponibilità del modello
Nota che la disponibilità dei modelli Anthropic varia in base alla regione. Cerca “Claude” in Vertex AI Model Garden o vai a Usa Claude 3 per le informazioni più recenti.ID modello API
| Modello | ID modello API Vertex AI |
|---|---|
| Claude Sonnet 4.5 | claude-sonnet-4-5@20250929Copied! |
| Claude Sonnet 4 | claude-sonnet-4@20250514Copied! |
| Claude Sonnet 3.7 | claude-3-7-sonnet@20250219Copied! |
| Claude Opus 4.1 | claude-opus-4-1@20250805Copied! |
| Claude Opus 4 | claude-opus-4@20250514Copied! |
| Claude Opus 3 | claude-3-opus@20240229Copied! |
| Claude Haiku 4.5 | claude-haiku-4-5@20251001Copied! |
| Claude Haiku 3.5 | claude-3-5-haiku@20241022Copied! |
| Claude Haiku 3 | claude-3-haiku@20240307Copied! |
Effettuare richieste
Prima di eseguire le richieste, potrebbe essere necessario eseguiregcloud auth application-default login per autenticarsi con GCP.
I seguenti esempi mostrano come generare testo da Claude su Vertex AI:
Registrazione dell’attività
Vertex fornisce un servizio di registrazione richiesta-risposta che consente ai clienti di registrare i prompt e i completamenti associati al tuo utilizzo. Anthropic consiglia di registrare la tua attività almeno su base mobile di 30 giorni per comprendere la tua attività e indagare su eventuali abusi.L’attivazione di questo servizio non dà a Google o Anthropic alcun accesso ai tuoi contenuti.
Supporto delle funzionalità
Puoi trovare tutte le funzionalità attualmente supportate su Vertex qui.Endpoint globali e regionali
A partire da Claude Sonnet 4.5 e tutti i modelli futuri, Google Vertex AI offre due tipi di endpoint:- Endpoint globali: Routing dinamico per la massima disponibilità
- Endpoint regionali: Routing dei dati garantito attraverso regioni geografiche specifiche
Questo si applica solo a Claude Sonnet 4.5 e ai modelli futuri. I modelli più vecchi (Claude Sonnet 4, Opus 4 e versioni precedenti) mantengono le loro strutture di prezzo esistenti.
Quando utilizzare ogni opzione
Endpoint globali (consigliato):- Forniscono la massima disponibilità e tempo di attività
- Instradano dinamicamente le richieste alle regioni con capacità disponibile
- Nessun premio di prezzo
- Ideale per applicazioni in cui la residenza dei dati è flessibile
- Supporta solo il traffico pay-as-you-go (la velocità effettiva fornita richiede endpoint regionali)
- Instradano il traffico attraverso regioni geografiche specifiche
- Richiesti per i requisiti di residenza dei dati e conformità
- Supportano sia il traffico pay-as-you-go che la velocità effettiva fornita
- Il premio di prezzo del 10% riflette i costi dell’infrastruttura per la capacità regionale dedicata
Implementazione
Utilizzo di endpoint globali (consigliato): Imposta il parametroregion su "global" quando inizializzi il client:
"us-east1" o "europe-west1":
Risorse aggiuntive
- Prezzi di Google Vertex AI: cloud.google.com/vertex-ai/generative-ai/pricing
- Documentazione dei modelli Claude: Claude su Vertex AI
- Post del blog di Google: Endpoint globale per i modelli Claude
- Dettagli sui prezzi di Anthropic: Documentazione sui prezzi