Gerencie custos de forma eficaz
Aprenda como rastrear e otimizar o uso de tokens e custos ao usar Claude Code.
Claude Code consome tokens para cada interação. O custo médio é de 12 para 90% dos usuários.
Para uso em equipe, Claude Code cobra pelo consumo de tokens da API. Em média, Claude Code custa ~$100-200/desenvolvedor por mês com Sonnet 4, embora haja grande variação dependendo de quantas instâncias os usuários estão executando e se estão usando em automação.
Rastreie seus custos
Usando o comando /cost
O comando /cost
não é destinado para assinantes Claude Max e Pro.
O comando /cost
fornece estatísticas detalhadas de uso de tokens para sua sessão atual:
Opções adicionais de rastreamento
Verifique uso histórico no Console Anthropic (requer função Admin ou Billing) e defina limites de gastos do workspace para o workspace Claude Code (requer função Admin).
Quando você autentica Claude Code pela primeira vez com sua conta do Console Anthropic, um workspace chamado “Claude Code” é automaticamente criado para você. Este workspace fornece rastreamento e gerenciamento centralizados de custos para todo o uso de Claude Code em sua organização.
Gerenciando custos para equipes
Ao usar a API Anthropic, você pode limitar o gasto total do workspace Claude Code. Para configurar, siga estas instruções. Administradores podem visualizar relatórios de custo e uso seguindo estas instruções.
No Bedrock e Vertex, Claude Code não envia métricas de sua nuvem. Para obter métricas de custo, várias grandes empresas relataram usar LiteLLM, que é uma ferramenta de código aberto que ajuda empresas a rastrear gastos por chave. Este projeto não é afiliado à Anthropic e não auditamos sua segurança.
Recomendações de limite de taxa
Ao configurar Claude Code para equipes, considere estas recomendações de Token Por Minuto (TPM) e Solicitação Por Minuto (RPM) por usuário baseadas no tamanho de sua organização:
Tamanho da equipe | TPM por usuário | RPM por usuário |
---|---|---|
1-5 usuários | 200k-300k | 5-7 |
5-20 usuários | 100k-150k | 2.5-3.5 |
20-50 usuários | 50k-75k | 1.25-1.75 |
50-100 usuários | 25k-35k | 0.62-0.87 |
100-500 usuários | 15k-20k | 0.37-0.47 |
500+ usuários | 10k-15k | 0.25-0.35 |
Por exemplo, se você tem 200 usuários, pode solicitar 20k TPM para cada usuário, ou 4 milhões de TPM total (200*20.000 = 4 milhões).
O TPM por usuário diminui conforme o tamanho da equipe cresce porque esperamos que menos usuários usem Claude Code simultaneamente em organizações maiores. Estes limites de taxa se aplicam no nível da organização, não por usuário individual, o que significa que usuários individuais podem temporariamente consumir mais do que sua parcela calculada quando outros não estão usando ativamente o serviço.
Se você antecipa cenários com uso simultâneo excepcionalmente alto (como sessões de treinamento ao vivo com grandes grupos), pode precisar de alocações de TPM mais altas por usuário.
Reduza o uso de tokens
-
Conversas compactas:
-
Claude usa auto-compactar por padrão quando o contexto excede 95% da capacidade
-
Alternar auto-compactar: Execute
/config
e navegue para “Auto-compact enabled” -
Use
/compact
manualmente quando o contexto ficar grande -
Adicione instruções personalizadas:
/compact Focus on code samples and API usage
-
Personalize a compactação adicionando ao CLAUDE.md:
-
-
Escreva consultas específicas: Evite solicitações vagas que acionam varredura desnecessária
-
Divida tarefas complexas: Divida tarefas grandes em interações focadas
-
Limpe o histórico entre tarefas: Use
/clear
para redefinir o contexto
Os custos podem variar significativamente baseados em:
- Tamanho da base de código sendo analisada
- Complexidade das consultas
- Número de arquivos sendo pesquisados ou modificados
- Duração do histórico de conversação
- Frequência de compactação de conversas
- Processos em segundo plano (geração de haiku, resumo de conversação)
Uso de tokens em segundo plano
Claude Code usa tokens para algumas funcionalidades em segundo plano mesmo quando inativo:
- Geração de haiku: Pequenas mensagens criativas que aparecem enquanto você digita (aproximadamente 1 centavo por dia)
- Resumo de conversação: Trabalhos em segundo plano que resumem conversas anteriores para o recurso
claude --resume
- Processamento de comandos: Alguns comandos como
/cost
podem gerar solicitações para verificar status
Esses processos em segundo plano consomem uma pequena quantidade de tokens (tipicamente menos de $0.04 por sessão) mesmo sem interação ativa.
Rastreando mudanças de versão e atualizações
Informações da versão atual
Para verificar sua versão atual do Claude Code e detalhes da instalação:
Este comando mostra sua versão, tipo de instalação e informações do sistema.
Entendendo mudanças no comportamento do Claude Code
Claude Code recebe atualizações regularmente que podem alterar como os recursos funcionam, incluindo relatórios de custo:
- Rastreamento de versão: Use
claude doctor
para ver sua versão atual - Mudanças de comportamento: Recursos como
/cost
podem exibir informações de forma diferente entre versões - Acesso à documentação: Claude sempre tem acesso à documentação mais recente, que pode ajudar a explicar o comportamento atual dos recursos
Quando os relatórios de custo mudam
Se você notar mudanças em como os custos são exibidos (como o comando /cost
mostrando informações diferentes):
- Verifique sua versão: Execute
claude doctor
para confirmar sua versão atual - Consulte a documentação: Pergunte diretamente ao Claude sobre o comportamento atual dos recursos, pois ele tem acesso à documentação atualizada
- Entre em contato com o suporte: Para questões específicas de cobrança, entre em contato com o suporte da Anthropic através de sua conta do Console
Para implantações em equipe, recomendamos começar com um pequeno grupo piloto para estabelecer padrões de uso antes de uma implementação mais ampla.