Preços dos modelos
A tabela a seguir mostra os preços para todos os modelos Claude em diferentes níveis de uso:| Model | Base Input Tokens | 5m Cache Writes | 1h Cache Writes | Cache Hits & Refreshes | Output Tokens |
|---|---|---|---|---|---|
| Claude Opus 4.1 | $15 / MTok | $18.75 / MTok | $30 / MTok | $1.50 / MTok | $75 / MTok |
| Claude Opus 4 | $15 / MTok | $18.75 / MTok | $30 / MTok | $1.50 / MTok | $75 / MTok |
| Claude Sonnet 4.5 | $3 / MTok | $3.75 / MTok | $6 / MTok | $0.30 / MTok | $15 / MTok |
| Claude Sonnet 4 | $3 / MTok | $3.75 / MTok | $6 / MTok | $0.30 / MTok | $15 / MTok |
| Claude Sonnet 3.7 | $3 / MTok | $3.75 / MTok | $6 / MTok | $0.30 / MTok | $15 / MTok |
| Claude Sonnet 3.5 (deprecated) | $3 / MTok | $3.75 / MTok | $6 / MTok | $0.30 / MTok | $15 / MTok |
| Claude Haiku 4.5 | $1 / MTok | $1.25 / MTok | $2 / MTok | $0.10 / MTok | $5 / MTok |
| Claude Haiku 3.5 | $0.80 / MTok | $1 / MTok | $1.6 / MTok | $0.08 / MTok | $4 / MTok |
| Claude Opus 3 (deprecated) | $15 / MTok | $18.75 / MTok | $30 / MTok | $1.50 / MTok | $75 / MTok |
| Claude Haiku 3 | $0.25 / MTok | $0.30 / MTok | $0.50 / MTok | $0.03 / MTok | $1.25 / MTok |
MTok = Milhão de tokens. A coluna “Base Input Tokens” mostra os preços padrão de entrada, “Cache Writes” e “Cache Hits” são específicos para cache de prompt, e “Output Tokens” mostra os preços de saída. O cache de prompt oferece durações de cache de 5 minutos (padrão) e 1 hora para otimizar custos para diferentes casos de uso.A tabela acima reflete os seguintes multiplicadores de preços para cache de prompt:
- Tokens de escrita de cache de 5 minutos são 1,25 vezes o preço dos tokens de entrada base
- Tokens de escrita de cache de 1 hora são 2 vezes o preço dos tokens de entrada base
- Tokens de leitura de cache são 0,1 vezes o preço dos tokens de entrada base
Preços de plataformas terceirizadas
Os modelos Claude estão disponíveis no AWS Bedrock e Google Vertex AI. Para preços oficiais, visite:Preços de endpoints regionais para modelos Claude 4.5 e posterioresComeçando com Claude Sonnet 4.5 e Haiku 4.5, AWS Bedrock e Google Vertex AI oferecem dois tipos de endpoints:
- Endpoints globais: Roteamento dinâmico entre regiões para máxima disponibilidade
- Endpoints regionais: Roteamento de dados garantido dentro de regiões geográficas específicas
Preços específicos de recursos
Processamento em lote
A API Batch permite processamento assíncrono de grandes volumes de solicitações com 50% de desconto em tokens de entrada e saída.| Model | Batch input | Batch output |
|---|---|---|
| Claude Opus 4.1 | $7.50 / MTok | $37.50 / MTok |
| Claude Opus 4 | $7.50 / MTok | $37.50 / MTok |
| Claude Sonnet 4.5 | $1.50 / MTok | $7.50 / MTok |
| Claude Sonnet 4 | $1.50 / MTok | $7.50 / MTok |
| Claude Sonnet 3.7 | $1.50 / MTok | $7.50 / MTok |
| Claude Sonnet 3.5 (deprecated) | $1.50 / MTok | $7.50 / MTok |
| Claude Haiku 4.5 | $0.50 / MTok | $2.50 / MTok |
| Claude Haiku 3.5 | $0.40 / MTok | $2 / MTok |
| Claude Opus 3 (deprecated) | $7.50 / MTok | $37.50 / MTok |
| Claude Haiku 3 | $0.125 / MTok | $0.625 / MTok |
Preços de contexto longo
Ao usar Claude Sonnet 4 ou Sonnet 4.5 com a janela de contexto de 1M tokens habilitada, solicitações que excedem 200K tokens de entrada são automaticamente cobradas com taxas premium de contexto longo:A janela de contexto de 1M tokens está atualmente em beta para organizações no nível de uso 4 e organizações com limites de taxa personalizados. A janela de contexto de 1M tokens está disponível apenas para Claude Sonnet 4 e Sonnet 4.5.
| ≤ 200K tokens de entrada | > 200K tokens de entrada |
|---|---|
| Entrada: $3 / MTok | Entrada: $6 / MTok |
| Saída: $15 / MTok | Saída: $22.50 / MTok |
- O desconto de 50% da API Batch se aplica aos preços de contexto longo
- Multiplicadores de cache de prompt se aplicam sobre os preços de contexto longo
Mesmo com a flag beta habilitada, solicitações com menos de 200K tokens de entrada são cobradas com taxas padrão. Se sua solicitação exceder 200K tokens de entrada, todos os tokens incorrem em preços premium.O limite de 200K é baseado apenas em tokens de entrada (incluindo leituras/escritas de cache). A contagem de tokens de saída não afeta a seleção do nível de preços, embora tokens de saída sejam cobrados com a taxa mais alta quando o limite de entrada é excedido.
usage na resposta da API:
input_tokenscache_creation_input_tokens(se usando cache de prompt)cache_read_input_tokens(se usando cache de prompt)
usage, consulte a documentação de resposta da API.
Preços de uso de ferramentas
Tool use requests are priced based on:- The total number of input tokens sent to the model (including in the
toolsparameter) - The number of output tokens generated
- For server-side tools, additional usage-based pricing (e.g., web search charges per search performed)
- The
toolsparameter in API requests (tool names, descriptions, and schemas) tool_usecontent blocks in API requests and responsestool_resultcontent blocks in API requests
tools, we also automatically include a special system prompt for the model which enables tool use. The number of tool use tokens required for each model are listed below (excluding the additional tokens listed above). Note that the table assumes at least 1 tool is provided. If no tools are provided, then a tool choice of none uses 0 additional system prompt tokens.
| Model | Tool choice | Tool use system prompt token count |
|---|---|---|
| Claude Opus 4.1 | auto, noneany, tool | 346 tokens 313 tokens |
| Claude Opus 4 | auto, noneany, tool | 346 tokens 313 tokens |
| Claude Sonnet 4.5 | auto, noneany, tool | 346 tokens 313 tokens |
| Claude Sonnet 4 | auto, noneany, tool | 346 tokens 313 tokens |
| Claude Sonnet 3.7 | auto, noneany, tool | 346 tokens 313 tokens |
| Claude Sonnet 3.5 (Oct) (deprecated) | auto, noneany, tool | 346 tokens 313 tokens |
| Claude Sonnet 3.5 (June) (deprecated) | auto, noneany, tool | 294 tokens 261 tokens |
| Claude Haiku 4.5 | auto, noneany, tool | 346 tokens 313 tokens |
| Claude Haiku 3.5 | auto, noneany, tool | 264 tokens 340 tokens |
| Claude Opus 3 (deprecated) | auto, noneany, tool | 530 tokens 281 tokens |
| Claude Sonnet 3 | auto, noneany, tool | 159 tokens 235 tokens |
| Claude Haiku 3 | auto, noneany, tool | 264 tokens 340 tokens |
Preços de ferramentas específicas
Ferramenta Bash
The bash tool adds 245 input tokens to your API calls. Additional tokens are consumed by:- Command outputs (stdout/stderr)
- Error messages
- Large file contents
Ferramenta de execução de código
The code execution tool usage is tracked separately from token usage. Execution time is a minimum of 5 minutes. If files are included in the request, execution time is billed even if the tool is not used due to files being preloaded onto the container. Pricing: $0.05 per session-hour.Ferramenta de editor de texto
The text editor tool uses the same pricing structure as other tools used with Claude. It follows the standard input and output token pricing based on the Claude model you’re using. In addition to the base tokens, the following additional input tokens are needed for the text editor tool:| Tool | Additional input tokens |
|---|---|
text_editor_20250429 (Claude 4) | 700 tokens |
text_editor_20250124 (Claude Sonnet 3.7) | 700 tokens |
text_editor_20241022 (Claude Sonnet 3.5 (deprecated)) | 700 tokens |
Ferramenta de busca na web
Web search usage is charged in addition to token usage:Ferramenta de busca na web
Web fetch usage has no additional charges beyond standard token costs:max_content_tokens parameter to set appropriate limits based on your use case and budget considerations.
Example token usage for typical content:
- Average web page (10KB): ~2,500 tokens
- Large documentation page (100KB): ~25,000 tokens
- Research paper PDF (500KB): ~125,000 tokens
Ferramenta de uso do computador
Computer use follows the standard tool use pricing. When using the computer use tool: System prompt overhead: The computer use beta adds 466-499 tokens to the system prompt Computer use tool token usage:| Model | Input tokens per tool definition |
|---|---|
| Claude 4.x models | 735 tokens |
| Claude Sonnet 3.7 | 735 tokens |
- Screenshot images (see Vision pricing)
- Tool execution results returned to Claude
If you’re also using bash or text editor tools alongside computer use, those tools have their own token costs as documented in their respective pages.
Exemplos de preços para casos de uso de agentes
Compreender os preços para aplicações de agentes é crucial ao construir com Claude. Estes exemplos do mundo real podem ajudá-lo a estimar custos para diferentes padrões de agentes.Exemplo de agente de suporte ao cliente
Ao construir um agente de suporte ao cliente, aqui está como os custos podem se dividir:Exemplo de cálculo para processar 10.000 tickets de suporte:
- Média de ~3.700 tokens por conversa
- Usando Claude Sonnet 4.5 a 15/MTok saída
- Custo total: ~$22.20 por 10.000 tickets
Preços de fluxo de trabalho de agente geral
Para arquiteturas de agentes mais complexas com múltiplas etapas:-
Processamento de solicitação inicial
- Entrada típica: 500-1.000 tokens
- Custo de processamento: ~$0.003 por solicitação
-
Recuperação de memória e contexto
- Contexto recuperado: 2.000-5.000 tokens
- Custo por recuperação: ~$0.015 por operação
-
Planejamento e execução de ação
- Tokens de planejamento: 1.000-2.000
- Feedback de execução: 500-1.000
- Custo combinado: ~$0.045 por ação
Estratégias de otimização de custos
Ao construir agentes com Claude:- Use modelos apropriados: Escolha Haiku para tarefas simples, Sonnet para raciocínio complexo
- Implemente cache de prompt: Reduza custos para contexto repetido
- Operações em lote: Use a API Batch para tarefas não sensíveis ao tempo
- Monitore padrões de uso: Rastreie o consumo de tokens para identificar oportunidades de otimização
Para aplicações de agentes de alto volume, considere entrar em contato com nossa equipe de vendas empresariais para arranjos de preços personalizados.
Considerações adicionais de preços
Limites de taxa
Os limites de taxa variam por nível de uso e afetam quantas solicitações você pode fazer:- Nível 1: Uso de nível básico com limites básicos
- Nível 2: Limites aumentados para aplicações em crescimento
- Nível 3: Limites mais altos para aplicações estabelecidas
- Nível 4: Limites padrão máximos
- Empresarial: Limites personalizados disponíveis
Descontos por volume
Descontos por volume podem estar disponíveis para usuários de alto volume. Estes são negociados caso a caso.- Níveis padrão usam os preços mostrados acima
- Clientes empresariais podem entrar em contato com vendas para preços personalizados
- Descontos acadêmicos e de pesquisa podem estar disponíveis
Preços empresariais
Para clientes empresariais com necessidades específicas:- Limites de taxa personalizados
- Descontos por volume
- Suporte dedicado
- Termos personalizados
Faturamento e pagamento
- O faturamento é calculado mensalmente com base no uso real
- Os pagamentos são processados em USD
- Opções de cartão de crédito e faturamento disponíveis
- Rastreamento de uso disponível no Console Claude