Gérer les coûts efficacement
Apprenez à suivre et optimiser l’utilisation des tokens et les coûts lors de l’utilisation de Claude Code.
Claude Code consomme des tokens pour chaque interaction. Le coût moyen est de 6 pour 90 % des utilisateurs.
Pour l’utilisation en équipe, Claude Code facture selon la consommation de tokens API. En moyenne, Claude Code coûte environ 100-200 $/développeur par mois avec Sonnet 4, bien qu’il y ait une grande variance selon le nombre d’instances que les utilisateurs exécutent et s’ils l’utilisent en automatisation.
Suivre vos coûts
Utilisation de la commande /cost
La commande /cost
n’est pas destinée aux abonnés Claude Max et Pro.
La commande /cost
fournit des statistiques détaillées d’utilisation des tokens pour votre session actuelle :
Options de suivi supplémentaires
Vérifiez l’utilisation historique dans la Console Anthropic (nécessite un rôle Admin ou Billing) et définissez les limites de dépenses de l’espace de travail pour l’espace de travail Claude Code (nécessite un rôle Admin).
Lorsque vous authentifiez Claude Code pour la première fois avec votre compte Console Anthropic, un espace de travail appelé “Claude Code” est automatiquement créé pour vous. Cet espace de travail fournit un suivi et une gestion centralisés des coûts pour toute l’utilisation de Claude Code dans votre organisation.
Gestion des coûts pour les équipes
Lors de l’utilisation de l’API Anthropic, vous pouvez limiter les dépenses totales de l’espace de travail Claude Code. Pour configurer, suivez ces instructions. Les administrateurs peuvent consulter les rapports de coûts et d’utilisation en suivant ces instructions.
Sur Bedrock et Vertex, Claude Code n’envoie pas de métriques depuis votre cloud. Afin d’obtenir des métriques de coût, plusieurs grandes entreprises ont rapporté utiliser LiteLLM, qui est un outil open-source qui aide les entreprises à suivre les dépenses par clé. Ce projet n’est pas affilié à Anthropic et nous n’avons pas audité sa sécurité.
Recommandations de limite de taux
Lors de la configuration de Claude Code pour les équipes, considérez ces recommandations de Tokens Par Minute (TPM) et Requêtes Par Minute (RPM) par utilisateur basées sur la taille de votre organisation :
Taille d’équipe | TPM par utilisateur | RPM par utilisateur |
---|---|---|
1-5 utilisateurs | 200k-300k | 5-7 |
5-20 utilisateurs | 100k-150k | 2.5-3.5 |
20-50 utilisateurs | 50k-75k | 1.25-1.75 |
50-100 utilisateurs | 25k-35k | 0.62-0.87 |
100-500 utilisateurs | 15k-20k | 0.37-0.47 |
500+ utilisateurs | 10k-15k | 0.25-0.35 |
Par exemple, si vous avez 200 utilisateurs, vous pourriez demander 20k TPM pour chaque utilisateur, ou 4 millions de TPM au total (200*20,000 = 4 millions).
Le TPM par utilisateur diminue à mesure que la taille de l’équipe augmente car nous nous attendons à ce que moins d’utilisateurs utilisent Claude Code simultanément dans les grandes organisations. Ces limites de taux s’appliquent au niveau de l’organisation, pas par utilisateur individuel, ce qui signifie que les utilisateurs individuels peuvent temporairement consommer plus que leur part calculée lorsque d’autres n’utilisent pas activement le service.
Si vous anticipez des scénarios avec une utilisation simultanée inhabituellement élevée (comme des sessions de formation en direct avec de grands groupes), vous pourriez avoir besoin d’allocations TPM plus élevées par utilisateur.
Réduire l’utilisation des tokens
-
Conversations compactes :
-
Claude utilise l’auto-compact par défaut lorsque le contexte dépasse 95 % de capacité
-
Basculer l’auto-compact : Exécutez
/config
et naviguez vers “Auto-compact enabled” -
Utilisez
/compact
manuellement lorsque le contexte devient important -
Ajoutez des instructions personnalisées :
/compact Focus on code samples and API usage
-
Personnalisez la compaction en ajoutant à CLAUDE.md :
-
-
Écrivez des requêtes spécifiques : Évitez les demandes vagues qui déclenchent un balayage inutile
-
Décomposez les tâches complexes : Divisez les grandes tâches en interactions ciblées
-
Effacez l’historique entre les tâches : Utilisez
/clear
pour réinitialiser le contexte
Les coûts peuvent varier considérablement selon :
- La taille de la base de code analysée
- La complexité des requêtes
- Le nombre de fichiers recherchés ou modifiés
- La longueur de l’historique de conversation
- La fréquence de compaction des conversations
- Les processus en arrière-plan (génération de haiku, résumé de conversation)
Utilisation des tokens en arrière-plan
Claude Code utilise des tokens pour certaines fonctionnalités en arrière-plan même en mode inactif :
- Génération de haiku : Petits messages créatifs qui apparaissent pendant que vous tapez (environ 1 cent par jour)
- Résumé de conversation : Tâches en arrière-plan qui résument les conversations précédentes pour la fonctionnalité
claude --resume
- Traitement des commandes : Certaines commandes comme
/cost
peuvent générer des requêtes pour vérifier le statut
Ces processus en arrière-plan consomment une petite quantité de tokens (généralement moins de 0,04 $ par session) même sans interaction active.
Suivi des changements de version et des mises à jour
Informations sur la version actuelle
Pour vérifier votre version actuelle de Claude Code et les détails d’installation :
Cette commande affiche votre version, le type d’installation et les informations système.
Comprendre les changements dans le comportement de Claude Code
Claude Code reçoit régulièrement des mises à jour qui peuvent changer le fonctionnement des fonctionnalités, y compris le rapport de coûts :
- Suivi de version : Utilisez
claude doctor
pour voir votre version actuelle - Changements de comportement : Les fonctionnalités comme
/cost
peuvent afficher les informations différemment selon les versions - Accès à la documentation : Claude a toujours accès à la documentation la plus récente, ce qui peut aider à expliquer le comportement actuel des fonctionnalités
Lorsque le rapport de coûts change
Si vous remarquez des changements dans la façon dont les coûts sont affichés (comme la commande /cost
montrant des informations différentes) :
- Vérifiez votre version : Exécutez
claude doctor
pour confirmer votre version actuelle - Consultez la documentation : Demandez directement à Claude le comportement actuel des fonctionnalités, car il a accès à la documentation à jour
- Contactez le support : Pour des questions de facturation spécifiques, contactez le support Anthropic via votre compte Console
Pour les déploiements d’équipe, nous recommandons de commencer avec un petit groupe pilote pour établir les modèles d’utilisation avant un déploiement plus large.