- No Vertex,
modelnão é passado no corpo da solicitação. Em vez disso, é especificado na URL do endpoint do Google Cloud. - No Vertex,
anthropic_versioné passado no corpo da solicitação (em vez de como um cabeçalho), e deve ser definido para o valorvertex-2023-10-16.
Instale um SDK para acessar o Vertex AI
Primeiro, instale o SDK de cliente da Anthropic para a linguagem de sua escolha.Acessando o Vertex AI
Disponibilidade de Modelos
Observe que a disponibilidade do modelo Anthropic varia por região. Procure por “Claude” no Vertex AI Model Garden ou acesse Usar Claude 3 para obter as informações mais recentes.IDs de modelo da API
| Modelo | ID do modelo da API Vertex AI |
|---|---|
| Claude Sonnet 4.5 | claude-sonnet-4-5@20250929Copied! |
| Claude Sonnet 4 | claude-sonnet-4@20250514Copied! |
| Claude Sonnet 3.7 | claude-3-7-sonnet@20250219Copied! |
| Claude Sonnet 3.5 | claude-3-5-sonnet-v2@20241022Copied! |
| Claude Opus 4.1 | claude-opus-4-1@20250805Copied! |
| Claude Opus 4 | claude-opus-4@20250514Copied! |
| Claude Opus 3 | claude-3-opus@20240229Copied! |
| Claude Haiku 4.5 | claude-haiku-4-5@20251001Copied! |
| Claude Haiku 3.5 | claude-3-5-haiku@20241022Copied! |
| Claude Haiku 3 | claude-3-haiku@20240307Copied! |
Fazendo solicitações
Antes de executar solicitações, você pode precisar executargcloud auth application-default login para se autenticar com o GCP.
O exemplo a seguir mostra como gerar texto a partir do Claude no Vertex AI:
Registro de atividades
O Vertex fornece um serviço de registro de solicitação-resposta que permite aos clientes registrar os prompts e conclusões associados ao seu uso. A Anthropic recomenda que você registre sua atividade em pelo menos uma base móvel de 30 dias para entender sua atividade e investigar qualquer possível uso indevido.Ativar este serviço não dá ao Google ou à Anthropic nenhum acesso ao seu conteúdo.
Suporte de recursos
Você pode encontrar todos os recursos atualmente suportados no Vertex aqui.Endpoints globais vs regionais
A partir de Claude Sonnet 4.5 e todos os modelos futuros, o Google Vertex AI oferece dois tipos de endpoint:- Endpoints globais: Roteamento dinâmico para máxima disponibilidade
- Endpoints regionais: Roteamento de dados garantido através de regiões geográficas específicas
Isto se aplica apenas ao Claude Sonnet 4.5 e modelos futuros. Modelos mais antigos (Claude Sonnet 4, Opus 4 e anteriores) mantêm suas estruturas de preço existentes.
Quando usar cada opção
Endpoints globais (recomendado):- Fornecem máxima disponibilidade e tempo de atividade
- Roteiam dinamicamente solicitações para regiões com capacidade disponível
- Sem prêmio de preço
- Melhor para aplicações onde a residência de dados é flexível
- Suporta apenas tráfego de pagamento conforme você usa (throughput provisionado requer endpoints regionais)
- Roteiam tráfego através de regiões geográficas específicas
- Necessários para requisitos de residência de dados e conformidade
- Suportam tráfego de pagamento conforme você usa e throughput provisionado
- Prêmio de preço de 10% reflete custos de infraestrutura para capacidade regional dedicada
Implementação
Usando endpoints globais (recomendado): Defina o parâmetroregion para "global" ao inicializar o cliente:
"us-east1" ou "europe-west1":
Recursos adicionais
- Preço do Google Vertex AI: cloud.google.com/vertex-ai/generative-ai/pricing
- Documentação dos modelos Claude: Claude no Vertex AI
- Postagem do blog do Google: Endpoint global para modelos Claude
- Detalhes de preço da Anthropic: Documentação de preço