Claude Code consome tokens para cada interação. O custo médio é de 6pordesenvolvedorpordia,comcustosdiaˊriospermanecendoabaixode6 por desenvolvedor por dia, com custos diários permanecendo abaixo de 12 para 90% dos usuários. Para uso em equipe, Claude Code cobra pelo consumo de tokens da API. Em média, Claude Code custa ~$100-200/desenvolvedor por mês com Sonnet 4.5, embora haja grande variação dependendo de quantas instâncias os usuários estão executando e se estão usando em automação.

Rastreie seus custos

Usando o comando /cost

O comando /cost não é destinado para assinantes Claude Max e Pro.
O comando /cost fornece estatísticas detalhadas de uso de tokens para sua sessão atual:
Total cost:            $0.55
Total duration (API):  6m 19.7s
Total duration (wall): 6h 33m 10.2s
Total code changes:    0 lines added, 0 lines removed

Opções adicionais de rastreamento

Verifique o uso histórico no Claude Console (requer função Admin ou Billing) e defina limites de gastos do workspace para o workspace Claude Code (requer função Admin).
Quando você autentica pela primeira vez o Claude Code com sua conta Claude Console, um workspace chamado “Claude Code” é automaticamente criado para você. Este workspace fornece rastreamento e gerenciamento centralizados de custos para todo o uso do Claude Code em sua organização. Você não pode criar chaves de API para este workspace - ele é exclusivamente para autenticação e uso do Claude Code.

Gerenciando custos para equipes

Ao usar a API Claude, você pode limitar o gasto total do workspace Claude Code. Para configurar, siga estas instruções. Administradores podem visualizar relatórios de custo e uso seguindo estas instruções. No Bedrock e Vertex, Claude Code não envia métricas de sua nuvem. Para obter métricas de custo, várias grandes empresas relataram usar LiteLLM, que é uma ferramenta de código aberto que ajuda empresas a rastrear gastos por chave. Este projeto não é afiliado à Anthropic e não auditamos sua segurança.

Recomendações de limite de taxa

Ao configurar Claude Code para equipes, considere estas recomendações de Token Por Minuto (TPM) e Solicitação Por Minuto (RPM) por usuário baseadas no tamanho de sua organização:
Tamanho da equipeTPM por usuárioRPM por usuário
1-5 usuários200k-300k5-7
5-20 usuários100k-150k2.5-3.5
20-50 usuários50k-75k1.25-1.75
50-100 usuários25k-35k0.62-0.87
100-500 usuários15k-20k0.37-0.47
500+ usuários10k-15k0.25-0.35
Por exemplo, se você tem 200 usuários, pode solicitar 20k TPM para cada usuário, ou 4 milhões de TPM total (200*20.000 = 4 milhões). O TPM por usuário diminui conforme o tamanho da equipe cresce porque esperamos que menos usuários usem Claude Code simultaneamente em organizações maiores. Estes limites de taxa se aplicam no nível da organização, não por usuário individual, o que significa que usuários individuais podem temporariamente consumir mais que sua parte calculada quando outros não estão usando ativamente o serviço.
Se você antecipa cenários com uso simultâneo excepcionalmente alto (como sessões de treinamento ao vivo com grupos grandes), pode precisar de alocações de TPM mais altas por usuário.

Reduza o uso de tokens

  • Conversas compactas:
    • Claude usa auto-compactação por padrão quando o contexto excede 95% da capacidade
    • Alternar auto-compactação: Execute /config e navegue para “Auto-compact enabled”
    • Use /compact manualmente quando o contexto ficar grande
    • Adicione instruções personalizadas: /compact Focus on code samples and API usage
    • Personalize a compactação adicionando ao CLAUDE.md:
      # Summary instructions
      
      When you are using compact, please focus on test output and code changes
      
  • Escreva consultas específicas: Evite solicitações vagas que acionam escaneamento desnecessário
  • Divida tarefas complexas: Divida tarefas grandes em interações focadas
  • Limpe o histórico entre tarefas: Use /clear para redefinir o contexto
Os custos podem variar significativamente baseados em:
  • Tamanho da base de código sendo analisada
  • Complexidade das consultas
  • Número de arquivos sendo pesquisados ou modificados
  • Duração do histórico de conversação
  • Frequência de compactação de conversas

Uso de tokens em segundo plano

Claude Code usa tokens para algumas funcionalidades em segundo plano mesmo quando inativo:
  • Resumo de conversação: Trabalhos em segundo plano que resumem conversas anteriores para o recurso claude --resume
  • Processamento de comandos: Alguns comandos como /cost podem gerar solicitações para verificar status
Esses processos em segundo plano consomem uma pequena quantidade de tokens (tipicamente menos de $0.04 por sessão) mesmo sem interação ativa.

Rastreando mudanças de versão e atualizações

Informações da versão atual

Para verificar sua versão atual do Claude Code e detalhes de instalação:
claude doctor
Este comando mostra sua versão, tipo de instalação e informações do sistema.

Entendendo mudanças no comportamento do Claude Code

Claude Code recebe atualizações regularmente que podem mudar como os recursos funcionam, incluindo relatórios de custo:
  • Rastreamento de versão: Use claude doctor para ver sua versão atual
  • Mudanças de comportamento: Recursos como /cost podem exibir informações de forma diferente entre versões
  • Acesso à documentação: Claude sempre tem acesso à documentação mais recente, que pode ajudar a explicar o comportamento atual dos recursos

Quando os relatórios de custo mudam

Se você notar mudanças em como os custos são exibidos (como o comando /cost mostrando informações diferentes):
  1. Verifique sua versão: Execute claude doctor para confirmar sua versão atual
  2. Consulte a documentação: Pergunte diretamente ao Claude sobre o comportamento atual dos recursos, pois ele tem acesso à documentação atualizada
  3. Entre em contato com o suporte: Para questões específicas de cobrança, entre em contato com o suporte da Anthropic através de sua conta Console
Para implantações em equipe, recomendamos começar com um pequeno grupo piloto para estabelecer padrões de uso antes de uma implementação mais ampla.