Claude 4.5 introduz dois modelos projetados para diferentes casos de uso:
  • Claude Sonnet 4.5: Nosso melhor modelo para agentes complexos e codificação, com a maior inteligência na maioria das tarefas
  • Claude Haiku 4.5: Nosso modelo Haiku mais rápido e inteligente com desempenho quase de fronteira. O primeiro modelo Haiku com pensamento estendido

Principais melhorias no Sonnet 4.5 em relação ao Sonnet 4

Excelência em codificação

Claude Sonnet 4.5 é nosso melhor modelo de codificação até hoje, com melhorias significativas em todo o ciclo de vida de desenvolvimento:
  • Desempenho SWE-bench Verified: Estado da arte avançado em benchmarks de codificação
  • Planejamento e design de sistema aprimorados: Melhores decisões arquiteturais e organização de código
  • Engenharia de segurança melhorada: Práticas de segurança mais robustas e detecção de vulnerabilidades
  • Melhor seguimento de instruções: Aderência mais precisa às especificações e requisitos de codificação
Claude Sonnet 4.5 tem desempenho significativamente melhor em tarefas de codificação quando o pensamento estendido está habilitado. O pensamento estendido está desabilitado por padrão, mas recomendamos habilitá-lo para trabalhos de codificação complexos. Esteja ciente de que o pensamento estendido impacta a eficiência do cache de prompt. Veja o guia de migração para detalhes de configuração.

Capacidades de agente

Claude Sonnet 4.5 introduz grandes avanços nas capacidades de agente:
  • Operação autônoma estendida: Sonnet 4.5 pode trabalhar independentemente por horas mantendo clareza e foco no progresso incremental. O modelo faz avanços constantes em algumas tarefas por vez em vez de tentar tudo de uma vez. Ele fornece atualizações de progresso baseadas em fatos que refletem com precisão o que foi realizado.
  • Consciência de contexto: Claude agora rastreia seu uso de tokens ao longo das conversas, recebendo atualizações após cada chamada de ferramenta. Essa consciência ajuda a prevenir o abandono prematuro de tarefas e permite execução mais eficaz em tarefas de longa duração. Veja Consciência de contexto para detalhes técnicos e orientação de prompting.
  • Uso de ferramenta aprimorado: O modelo usa mais efetivamente chamadas de ferramenta paralelas, disparando múltiplas buscas especulativas simultaneamente durante pesquisas e lendo vários arquivos de uma vez para construir contexto mais rapidamente. Coordenação melhorada entre múltiplas ferramentas e fontes de informação permite que o modelo aproveite efetivamente uma ampla gama de capacidades em fluxos de trabalho de busca agêntica e codificação.
  • Gerenciamento de contexto avançado: Sonnet 4.5 mantém rastreamento de estado excepcional em arquivos externos, preservando orientação a objetivos entre sessões. Combinado com uso mais eficaz da janela de contexto e nossos novos recursos de API de gerenciamento de contexto, o modelo lida otimamente com informações em sessões estendidas para manter coerência ao longo do tempo.
Consciência de contexto está disponível no Claude Sonnet 4, Sonnet 4.5, Haiku 4.5, Opus 4 e Opus 4.1.

Comunicação e estilo de interação

Claude Sonnet 4.5 tem uma abordagem de comunicação refinada que é concisa, direta e natural. Ele fornece atualizações de progresso baseadas em fatos e pode pular resumos verbosos após chamadas de ferramenta para manter o momentum do fluxo de trabalho (embora isso possa ser ajustado com prompting). Para orientação detalhada sobre trabalhar com este estilo de comunicação, veja Melhores práticas do Claude 4.

Geração de conteúdo criativo

Claude Sonnet 4.5 se destaca em tarefas de conteúdo criativo:
  • Apresentações e animações: Iguala ou supera Claude Opus 4.1 para criar slides e conteúdo visual
  • Toque criativo: Produz saída polida e profissional com forte seguimento de instruções
  • Qualidade na primeira tentativa: Gera conteúdo utilizável e bem projetado em tentativas iniciais

Principais melhorias no Haiku 4.5 em relação ao Haiku 3.5

Claude Haiku 4.5 representa um salto transformativo para a família de modelos Haiku, trazendo capacidades de fronteira para nossa classe de modelo mais rápida:

Inteligência quase de fronteira com velocidade impressionante

Claude Haiku 4.5 oferece desempenho quase de fronteira igualando Sonnet 4 a custo significativamente menor e velocidade mais rápida:
  • Inteligência quase de fronteira: Iguala o desempenho do Sonnet 4 em raciocínio, codificação e tarefas complexas
  • Velocidade aprimorada: Mais que o dobro da velocidade do Sonnet 4, com otimizações para tokens de saída por segundo (OTPS)
  • Custo-desempenho ótimo: Inteligência quase de fronteira a um terço do custo, ideal para implantações de alto volume

Capacidades de pensamento estendido

Claude Haiku 4.5 é o primeiro modelo Haiku a suportar pensamento estendido, trazendo capacidades de raciocínio avançadas para a família Haiku:
  • Raciocínio em velocidade: Acesso ao processo de raciocínio interno do Claude para resolução de problemas complexos
  • Resumo de pensamento: Saída de pensamento resumida para implantações prontas para produção
  • Pensamento intercalado: Pensar entre chamadas de ferramenta para fluxos de trabalho multi-etapas mais sofisticados
  • Controle de orçamento: Configurar orçamentos de tokens de pensamento para equilibrar profundidade de raciocínio com velocidade
O pensamento estendido deve ser habilitado explicitamente adicionando um parâmetro thinking às suas solicitações de API. Veja a documentação de Pensamento estendido para detalhes de implementação.
Claude Haiku 4.5 tem desempenho significativamente melhor em tarefas de codificação e raciocínio quando o pensamento estendido está habilitado. O pensamento estendido está desabilitado por padrão, mas recomendamos habilitá-lo para resolução de problemas complexos, trabalho de codificação e raciocínio multi-etapas. Esteja ciente de que o pensamento estendido impacta a eficiência do cache de prompt. Veja o guia de migração para detalhes de configuração.
Disponível no Claude Sonnet 3.7, Sonnet 4, Sonnet 4.5, Haiku 4.5, Opus 4 e Opus 4.1.

Consciência de contexto

Claude Haiku 4.5 apresenta consciência de contexto, permitindo que o modelo rastreie sua janela de contexto restante ao longo de uma conversa:
  • Rastreamento de orçamento de tokens: Claude recebe atualizações em tempo real sobre capacidade de contexto restante após cada chamada de ferramenta
  • Melhor persistência de tarefas: O modelo pode executar tarefas mais efetivamente entendendo o espaço de trabalho disponível
  • Fluxos de trabalho multi-janela de contexto: Manuseio melhorado de transições de estado em sessões estendidas
Este é o primeiro modelo Haiku com capacidades nativas de consciência de contexto. Para orientação de prompting, veja Melhores práticas do Claude 4.
Disponível no Claude Sonnet 4, Sonnet 4.5, Haiku 4.5, Opus 4 e Opus 4.1.

Codificação forte e uso de ferramentas

Claude Haiku 4.5 oferece capacidades robustas de codificação esperadas dos modelos Claude modernos:
  • Proficiência em codificação: Desempenho forte em tarefas de geração de código, depuração e refatoração
  • Suporte completo a ferramentas: Compatível com todas as ferramentas do Claude 4 incluindo bash, execução de código, editor de texto, busca web e uso de computador
  • Uso de computador aprimorado: Otimizado para interação autônoma de desktop e fluxos de trabalho de automação de navegador
  • Execução de ferramenta paralela: Coordenação eficiente entre múltiplas ferramentas para fluxos de trabalho complexos
Haiku 4.5 é projetado para casos de uso que exigem tanto inteligência quanto eficiência:
  • Aplicações em tempo real: Tempos de resposta rápidos para experiências de usuário interativas
  • Processamento de alto volume: Inteligência custo-efetiva para implantações em larga escala
  • Implementações de nível gratuito: Qualidade de modelo premium a preços acessíveis
  • Arquiteturas de sub-agente: Agentes rápidos e inteligentes para sistemas multi-agente
  • Uso de computador em escala: Automação de desktop e navegador autônoma custo-efetiva

Novos recursos de API

Ferramenta de memória (Beta)

A nova ferramenta de memória permite que Claude armazene e recupere informações fora da janela de contexto:
tools=[
    {
        "type": "memory_20250818",
        "name": "memory"
    }
]
Isso permite:
  • Construir bases de conhecimento ao longo do tempo
  • Manter estado de projeto entre sessões
  • Preservar contexto efetivamente ilimitado através de armazenamento baseado em arquivo
Disponível no Claude Sonnet 4, Sonnet 4.5, Haiku 4.5, Opus 4 e Opus 4.1. Requer cabeçalho beta: context-management-2025-06-27

Edição de contexto

Use edição de contexto para gerenciamento inteligente de contexto através de limpeza automática de chamadas de ferramenta:
response = client.beta.messages.create(
    betas=["context-management-2025-06-27"],
    model="claude-sonnet-4-5",  # ou claude-haiku-4-5
    max_tokens=4096,
    messages=[{"role": "user", "content": "..."}],
    context_management={
        "edits": [
            {
                "type": "clear_tool_uses_20250919",
                "trigger": {"type": "input_tokens", "value": 500},
                "keep": {"type": "tool_uses", "value": 2},
                "clear_at_least": {"type": "input_tokens", "value": 100}
            }
        ]
    },
    tools=[...]
)
Este recurso remove automaticamente chamadas de ferramenta e resultados mais antigos ao se aproximar dos limites de tokens, ajudando a gerenciar contexto em sessões de agente de longa duração.
Disponível no Claude Sonnet 4, Sonnet 4.5, Haiku 4.5, Opus 4 e Opus 4.1. Requer cabeçalho beta: context-management-2025-06-27

Razões de parada aprimoradas

Os modelos Claude 4.5 introduzem uma nova razão de parada model_context_window_exceeded que indica explicitamente quando a geração parou devido ao atingimento do limite da janela de contexto, em vez do limite max_tokens solicitado. Isso torna mais fácil lidar com limites de janela de contexto na lógica da sua aplicação.
{
  "stop_reason": "model_context_window_exceeded",
  "usage": {
    "input_tokens": 150000,
    "output_tokens": 49950
  }
}

Manuseio melhorado de parâmetros de ferramenta

Os modelos Claude 4.5 incluem uma correção de bug que preserva formatação intencional em parâmetros de string de chamadas de ferramenta. Anteriormente, quebras de linha finais em parâmetros de string eram às vezes incorretamente removidas. Esta correção garante que ferramentas que requerem formatação precisa (como editores de texto) recebam parâmetros exatamente como pretendido.
Esta é uma melhoria nos bastidores sem mudanças de API necessárias. No entanto, ferramentas com parâmetros de string podem agora receber valores com quebras de linha finais que eram anteriormente removidas.
Exemplo:
// Antes: Quebra de linha final acidentalmente removida
{
  "type": "tool_use",
  "id": "toolu_01A09q90qw90lq917835lq9",
  "name": "edit_todo",
  "input": {
    "file": "todo.txt",
    "contents": "1. Chop onions.\n2. ???\n3. Profit"
  }
}

// Depois: Quebra de linha final preservada como pretendido
{
  "type": "tool_use",
  "id": "toolu_01A09q90qw90lq917835lq9",
  "name": "edit_todo",
  "input": {
    "file": "todo.txt",
    "contents": "1. Chop onions.\n2. ???\n3. Profit\n"
  }
}

Otimizações de contagem de tokens

Os modelos Claude 4.5 incluem otimizações automáticas para melhorar o desempenho do modelo. Essas otimizações podem adicionar pequenas quantidades de tokens às solicitações, mas você não é cobrado por esses tokens adicionados pelo sistema.

Recursos introduzidos no Claude 4

Os seguintes recursos foram introduzidos no Claude 4 e estão disponíveis em todos os modelos Claude 4, incluindo Claude Sonnet 4.5 e Claude Haiku 4.5.

Nova razão de parada de recusa

Os modelos Claude 4 introduzem uma nova razão de parada refusal para conteúdo que o modelo se recusa a gerar por razões de segurança:
{"id":"msg_014XEDjypDjFzgKVWdFUXxZP",
"type":"message",
"role":"assistant",
"model":"claude-sonnet-4-5",
"content":[{"type":"text","text":"I would be happy to assist you. You can "}],
"stop_reason":"refusal",
"stop_sequence":null,
"usage":{"input_tokens":564,"cache_creation_input_tokens":0,"cache_read_input_tokens":0,"output_tokens":22}
}
Ao usar modelos Claude 4, você deve atualizar sua aplicação para lidar com razões de parada refusal.

Pensamento resumido

Com pensamento estendido habilitado, a API Messages para modelos Claude 4 retorna um resumo do processo completo de pensamento do Claude. O pensamento resumido fornece todos os benefícios de inteligência do pensamento estendido, enquanto previne uso indevido. Embora a API seja consistente entre os modelos Claude 3.7 e 4, respostas de streaming para pensamento estendido podem retornar em um padrão de entrega “em pedaços”, com possíveis atrasos entre eventos de streaming.
A sumarização é processada por um modelo diferente daquele que você direciona em suas solicitações. O modelo de pensamento não vê a saída resumida.
Para mais informações, veja a documentação de Pensamento estendido.

Pensamento intercalado

Os modelos Claude 4 suportam intercalar uso de ferramenta com pensamento estendido, permitindo conversas mais naturais onde usos de ferramenta e respostas podem ser misturados com mensagens regulares.
Pensamento intercalado está em beta. Para habilitar pensamento intercalado, adicione o cabeçalho beta interleaved-thinking-2025-05-14 à sua solicitação de API.
Para mais informações, veja a documentação de Pensamento estendido.

Diferenças comportamentais

Os modelos Claude 4 têm mudanças comportamentais notáveis que podem afetar como você estrutura prompts:

Mudanças no estilo de comunicação

  • Mais conciso e direto: Os modelos Claude 4 se comunicam de forma mais eficiente, com explicações menos verbosas
  • Tom mais natural: As respostas são ligeiramente mais conversacionais e menos mecânicas
  • Focado em eficiência: Pode pular resumos detalhados após completar ações para manter o momentum do fluxo de trabalho (você pode solicitar mais detalhes se necessário)

Seguimento de instruções

Os modelos Claude 4 são treinados para seguimento preciso de instruções e requerem direção mais explícita:
  • Seja explícito sobre ações: Use linguagem direta como “Faça essas mudanças” ou “Implemente este recurso” em vez de “Você pode sugerir mudanças” se quiser que Claude tome ação
  • Declare comportamentos desejados claramente: Claude seguirá instruções precisamente, então ser específico sobre o que você quer ajuda a alcançar melhores resultados
Para orientação abrangente sobre trabalhar com esses modelos, veja Melhores práticas de engenharia de prompt do Claude 4.

Ferramenta de editor de texto atualizada

A ferramenta de editor de texto foi atualizada para modelos Claude 4 com as seguintes mudanças:
  • Tipo de ferramenta: text_editor_20250728
  • Nome da ferramenta: str_replace_based_edit_tool
  • O comando undo_edit não é mais suportado
A ferramenta de editor de texto str_replace_editor permanece a mesma para Claude Sonnet 3.7.
Se você está migrando do Claude Sonnet 3.7 e usando a ferramenta de editor de texto:
# Claude Sonnet 3.7
tools=[
    {
        "type": "text_editor_20250124",
        "name": "str_replace_editor"
    }
]

# Modelos Claude 4
tools=[
    {
        "type": "text_editor_20250728",
        "name": "str_replace_based_edit_tool"
    }
]
Para mais informações, veja a documentação da ferramenta Editor de texto.

Ferramenta de execução de código atualizada

Se você está usando a ferramenta de execução de código, certifique-se de estar usando a versão mais recente code_execution_20250825, que adiciona comandos Bash e capacidades de manipulação de arquivo. A versão legada code_execution_20250522 (apenas Python) ainda está disponível mas não é recomendada para novas implementações. Para instruções de migração, veja a documentação da ferramenta Execução de código.

Preços e disponibilidade

Preços

Os modelos Claude 4.5 mantêm preços competitivos:
ModeloEntradaSaída
Claude Sonnet 4.5$3 por milhão de tokens$15 por milhão de tokens
Claude Haiku 4.5$1 por milhão de tokens$5 por milhão de tokens
Para mais detalhes, veja a documentação de preços.

Preços de plataforma de terceiros

Começando com os modelos Claude 4.5 (Sonnet 4.5 e Haiku 4.5), AWS Bedrock e Google Vertex AI oferecem dois tipos de endpoint:
  • Endpoints globais: Roteamento dinâmico para máxima disponibilidade
  • Endpoints regionais: Roteamento de dados garantido através de regiões geográficas específicas com um prêmio de preço de 10%
Este preço regional se aplica tanto ao Claude Sonnet 4.5 quanto ao Claude Haiku 4.5. A API Claude (1P) é global por padrão e não é afetada por esta mudança. A API Claude é apenas global (equivalente à oferta de endpoint global e preços de outros provedores). Para detalhes de implementação e orientação de migração:

Disponibilidade

Os modelos Claude 4.5 estão disponíveis em:
ModeloAPI ClaudeAmazon BedrockGoogle Cloud Vertex AI
Claude Sonnet 4.5claude-sonnet-4-5-20250929anthropic.claude-sonnet-4-5-20250929-v1:0claude-sonnet-4-5@20250929
Claude Haiku 4.5claude-haiku-4-5-20251001anthropic.claude-haiku-4-5-20251001-v1:0claude-haiku-4-5@20251001
Também disponível através das plataformas Claude.ai e Claude Code.

Guia de migração

Mudanças disruptivas e requisitos de migração variam dependendo de qual modelo você está atualizando. Para instruções detalhadas de migração, incluindo guias passo a passo, mudanças disruptivas e listas de verificação de migração, veja Migrando para Claude 4.5. O guia de migração cobre os seguintes cenários:
  • Claude Sonnet 3.7 → Sonnet 4.5: Caminho de migração completo com mudanças disruptivas
  • Claude Haiku 3.5 → Haiku 4.5: Caminho de migração completo com mudanças disruptivas
  • Claude Sonnet 4 → Sonnet 4.5: Atualização rápida com mudanças mínimas
  • Claude Opus 4.1 → Sonnet 4.5: Atualização sem problemas sem mudanças disruptivas

Próximos passos