Claude su Vertex AI

L’API Vertex per accedere a Claude è quasi identica all’API Messages e supporta tutte le stesse opzioni, con due differenze chiave:

In Vertex, model non viene passato nel corpo della richiesta. Invece, viene specificato nell’URL dell’endpoint di Google Cloud.
In Vertex, anthropic_version viene passato nel corpo della richiesta (piuttosto che come intestazione) e deve essere impostato al valore vertex-2023-10-16.

Vertex è supportato anche dagli SDK client ufficiali di Anthropic. Questa guida ti guiderà attraverso il processo di effettuare una richiesta a Claude su Vertex AI in Python o TypeScript. Nota che questa guida presuppone che tu abbia già un progetto GCP in grado di utilizzare Vertex AI. Vedi utilizzo dei modelli Claude 3 di Anthropic per ulteriori informazioni sulla configurazione richiesta, nonché una procedura dettagliata completa.

Installa un SDK per accedere a Vertex AI

Per prima cosa, installa l’SDK client di Anthropic per il linguaggio di tua scelta.

pip install -U google-cloud-aiplatform "anthropic[vertex]"

Accesso a Vertex AI

Disponibilità del modello

Nota che la disponibilità dei modelli Anthropic varia in base alla regione. Cerca “Claude” in Vertex AI Model Garden o vai a Usa Claude 3 per le informazioni più recenti.

ID modello API

Modello	ID modello API Vertex AI
Claude Sonnet 4.5	claude-sonnet-4-5@20250929Copied!
Claude Sonnet 4	claude-sonnet-4@20250514Copied!
Claude Sonnet 3.7	claude-3-7-sonnet@20250219Copied!
Claude Opus 4.1	claude-opus-4-1@20250805Copied!
Claude Opus 4	claude-opus-4@20250514Copied!
Claude Opus 3	claude-3-opus@20240229Copied!
Claude Haiku 4.5	claude-haiku-4-5@20251001Copied!
Claude Haiku 3.5	claude-3-5-haiku@20241022Copied!
Claude Haiku 3	claude-3-haiku@20240307Copied!

Effettuare richieste

Prima di eseguire le richieste, potrebbe essere necessario eseguire gcloud auth application-default login per autenticarsi con GCP. I seguenti esempi mostrano come generare testo da Claude su Vertex AI:

from anthropic import AnthropicVertex

project_id = "MY_PROJECT_ID"
region = "global"

client = AnthropicVertex(project_id=project_id, region=region)

message = client.messages.create(
    model="claude-sonnet-4-5@20250929",
    max_tokens=100,
    messages=[
        {
            "role": "user",
            "content": "Hey Claude!",
        }
    ],
)
print(message)

Vedi i nostri SDK client e la documentazione ufficiale di Vertex AI per ulteriori dettagli.

Registrazione dell’attività

Vertex fornisce un servizio di registrazione richiesta-risposta che consente ai clienti di registrare i prompt e i completamenti associati al tuo utilizzo. Anthropic consiglia di registrare la tua attività almeno su base mobile di 30 giorni per comprendere la tua attività e indagare su eventuali abusi.

L’attivazione di questo servizio non dà a Google o Anthropic alcun accesso ai tuoi contenuti.

Supporto delle funzionalità

Puoi trovare tutte le funzionalità attualmente supportate su Vertex qui.

Endpoint globali e regionali

A partire da Claude Sonnet 4.5 e tutti i modelli futuri, Google Vertex AI offre due tipi di endpoint:

Endpoint globali: Routing dinamico per la massima disponibilità
Endpoint regionali: Routing dei dati garantito attraverso regioni geografiche specifiche

Gli endpoint regionali includono un premio di prezzo del 10% rispetto agli endpoint globali.

Questo si applica solo a Claude Sonnet 4.5 e ai modelli futuri. I modelli più vecchi (Claude Sonnet 4, Opus 4 e versioni precedenti) mantengono le loro strutture di prezzo esistenti.

Quando utilizzare ogni opzione

Endpoint globali (consigliato):

Forniscono la massima disponibilità e tempo di attività
Instradano dinamicamente le richieste alle regioni con capacità disponibile
Nessun premio di prezzo
Ideale per applicazioni in cui la residenza dei dati è flessibile
Supporta solo il traffico pay-as-you-go (la velocità effettiva fornita richiede endpoint regionali)

Endpoint regionali:

Instradano il traffico attraverso regioni geografiche specifiche
Richiesti per i requisiti di residenza dei dati e conformità
Supportano sia il traffico pay-as-you-go che la velocità effettiva fornita
Il premio di prezzo del 10% riflette i costi dell’infrastruttura per la capacità regionale dedicata

Implementazione

Utilizzo di endpoint globali (consigliato): Imposta il parametro region su "global" quando inizializzi il client:

from anthropic import AnthropicVertex

project_id = "MY_PROJECT_ID"
region = "global"

client = AnthropicVertex(project_id=project_id, region=region)

message = client.messages.create(
    model="claude-sonnet-4-5@20250929",
    max_tokens=100,
    messages=[
        {
            "role": "user",
            "content": "Hey Claude!",
        }
    ],
)
print(message)

Utilizzo di endpoint regionali: Specifica una regione specifica come "us-east1" o "europe-west1":

from anthropic import AnthropicVertex

project_id = "MY_PROJECT_ID"
region = "us-east1"  # Specify a specific region

client = AnthropicVertex(project_id=project_id, region=region)

message = client.messages.create(
    model="claude-sonnet-4-5@20250929",
    max_tokens=100,
    messages=[
        {
            "role": "user",
            "content": "Hey Claude!",
        }
    ],
)
print(message)

Risorse aggiuntive

Prezzi di Google Vertex AI: cloud.google.com/vertex-ai/generative-ai/pricing
Documentazione dei modelli Claude: Claude su Vertex AI
Post del blog di Google: Endpoint globale per i modelli Claude
Dettagli sui prezzi di Anthropic: Documentazione sui prezzi

Primi passi

Modelli e prezzi

Crea con Claude

Capacità

Strumenti

Competenze Agente

Agent SDK

MCP nell'API

Claude su piattaforme di terze parti

Ingegneria dei prompt

Testa e valuta

Rafforza le protezioni

Installa un SDK per accedere a Vertex AI

Accesso a Vertex AI

Disponibilità del modello

ID modello API

Effettuare richieste

Registrazione dell’attività

Supporto delle funzionalità

Endpoint globali e regionali

Quando utilizzare ogni opzione

Implementazione

Risorse aggiuntive

Primi passi

Modelli e prezzi

Crea con Claude

Capacità

Strumenti

Competenze Agente

Agent SDK

MCP nell'API

Claude su piattaforme di terze parti

Ingegneria dei prompt

Testa e valuta

Rafforza le protezioni

​Installa un SDK per accedere a Vertex AI

​Accesso a Vertex AI

​Disponibilità del modello

​ID modello API

​Effettuare richieste

​Registrazione dell’attività

​Supporto delle funzionalità

​Endpoint globali e regionali

​Quando utilizzare ogni opzione

​Implementazione

​Risorse aggiuntive

Installa un SDK per accedere a Vertex AI

Accesso a Vertex AI

Disponibilità del modello

ID modello API

Effettuare richieste

Registrazione dell’attività

Supporto delle funzionalità

Endpoint globali e regionali

Quando utilizzare ogni opzione

Implementazione

Risorse aggiuntive