Tarification des modèles
Le tableau suivant présente la tarification de tous les modèles Claude selon différents niveaux d’utilisation :| Model | Base Input Tokens | 5m Cache Writes | 1h Cache Writes | Cache Hits & Refreshes | Output Tokens |
|---|---|---|---|---|---|
| Claude Opus 4.1 | $15 / MTok | $18.75 / MTok | $30 / MTok | $1.50 / MTok | $75 / MTok |
| Claude Opus 4 | $15 / MTok | $18.75 / MTok | $30 / MTok | $1.50 / MTok | $75 / MTok |
| Claude Sonnet 4.5 | $3 / MTok | $3.75 / MTok | $6 / MTok | $0.30 / MTok | $15 / MTok |
| Claude Sonnet 4 | $3 / MTok | $3.75 / MTok | $6 / MTok | $0.30 / MTok | $15 / MTok |
| Claude Sonnet 3.7 (deprecated) | $3 / MTok | $3.75 / MTok | $6 / MTok | $0.30 / MTok | $15 / MTok |
| Claude Haiku 4.5 | $1 / MTok | $1.25 / MTok | $2 / MTok | $0.10 / MTok | $5 / MTok |
| Claude Haiku 3.5 | $0.80 / MTok | $1 / MTok | $1.6 / MTok | $0.08 / MTok | $4 / MTok |
| Claude Opus 3 (deprecated) | $15 / MTok | $18.75 / MTok | $30 / MTok | $1.50 / MTok | $75 / MTok |
| Claude Haiku 3 | $0.25 / MTok | $0.30 / MTok | $0.50 / MTok | $0.03 / MTok | $1.25 / MTok |
MTok = Million de tokens. La colonne “Base Input Tokens” indique la tarification standard d’entrée, “Cache Writes” et “Cache Hits” sont spécifiques à la mise en cache des prompts, et “Output Tokens” indique la tarification de sortie. La mise en cache des prompts offre des durées de cache de 5 minutes (par défaut) et 1 heure pour optimiser les coûts selon différents cas d’usage.Le tableau ci-dessus reflète les multiplicateurs de tarification suivants pour la mise en cache des prompts :
- Les tokens d’écriture de cache de 5 minutes coûtent 1,25 fois le prix des tokens d’entrée de base
- Les tokens d’écriture de cache de 1 heure coûtent 2 fois le prix des tokens d’entrée de base
- Les tokens de lecture de cache coûtent 0,1 fois le prix des tokens d’entrée de base
Tarification des plateformes tierces
Les modèles Claude sont disponibles sur AWS Bedrock et Google Vertex AI. Pour la tarification officielle, visitez :Tarification des points de terminaison régionaux pour les modèles Claude 4.5 et ultérieursÀ partir de Claude Sonnet 4.5 et Haiku 4.5, AWS Bedrock et Google Vertex AI offrent deux types de points de terminaison :
- Points de terminaison globaux : Routage dynamique entre régions pour une disponibilité maximale
- Points de terminaison régionaux : Routage des données garanti dans des régions géographiques spécifiques
Tarification spécifique aux fonctionnalités
Traitement par lots
L’API Batch permet le traitement asynchrone de gros volumes de requêtes avec une remise de 50% sur les tokens d’entrée et de sortie.| Model | Batch input | Batch output |
|---|---|---|
| Claude Opus 4.1 | $7.50 / MTok | $37.50 / MTok |
| Claude Opus 4 | $7.50 / MTok | $37.50 / MTok |
| Claude Sonnet 4.5 | $1.50 / MTok | $7.50 / MTok |
| Claude Sonnet 4 | $1.50 / MTok | $7.50 / MTok |
| Claude Sonnet 3.7 (deprecated) | $1.50 / MTok | $7.50 / MTok |
| Claude Haiku 4.5 | $0.50 / MTok | $2.50 / MTok |
| Claude Haiku 3.5 | $0.40 / MTok | $2 / MTok |
| Claude Opus 3 (deprecated) | $7.50 / MTok | $37.50 / MTok |
| Claude Haiku 3 | $0.125 / MTok | $0.625 / MTok |
Tarification du contexte long
Lors de l’utilisation de Claude Sonnet 4 ou Sonnet 4.5 avec la fenêtre de contexte de 1M tokens activée, les requêtes qui dépassent 200K tokens d’entrée sont automatiquement facturées aux tarifs premium de contexte long :La fenêtre de contexte de 1M tokens est actuellement en bêta pour les organisations du niveau d’utilisation 4 et les organisations avec des limites de taux personnalisées. La fenêtre de contexte de 1M tokens n’est disponible que pour Claude Sonnet 4 et Sonnet 4.5.
| ≤ 200K tokens d’entrée | > 200K tokens d’entrée |
|---|---|
| Entrée : 3 $ / MTok | Entrée : 6 $ / MTok |
| Sortie : 15 $ / MTok | Sortie : 22,50 $ / MTok |
- La remise de 50% de l’API Batch s’applique à la tarification du contexte long
- Les multiplicateurs de mise en cache des prompts s’appliquent en plus de la tarification du contexte long
Même avec le flag bêta activé, les requêtes avec moins de 200K tokens d’entrée sont facturées aux tarifs standard. Si votre requête dépasse 200K tokens d’entrée, tous les tokens encourent la tarification premium.Le seuil de 200K est basé uniquement sur les tokens d’entrée (incluant les lectures/écritures de cache). Le nombre de tokens de sortie n’affecte pas la sélection du niveau tarifaire, bien que les tokens de sortie soient facturés au tarif plus élevé lorsque le seuil d’entrée est dépassé.
usage dans la réponse API :
input_tokenscache_creation_input_tokens(si vous utilisez la mise en cache des prompts)cache_read_input_tokens(si vous utilisez la mise en cache des prompts)
usage, consultez la documentation de réponse API.
Tarification de l’utilisation d’outils
Tool use requests are priced based on:- The total number of input tokens sent to the model (including in the
toolsparameter) - The number of output tokens generated
- For server-side tools, additional usage-based pricing (e.g., web search charges per search performed)
- The
toolsparameter in API requests (tool names, descriptions, and schemas) tool_usecontent blocks in API requests and responsestool_resultcontent blocks in API requests
tools, we also automatically include a special system prompt for the model which enables tool use. The number of tool use tokens required for each model are listed below (excluding the additional tokens listed above). Note that the table assumes at least 1 tool is provided. If no tools are provided, then a tool choice of none uses 0 additional system prompt tokens.
| Model | Tool choice | Tool use system prompt token count |
|---|---|---|
| Claude Opus 4.1 | auto, noneany, tool | 346 tokens 313 tokens |
| Claude Opus 4 | auto, noneany, tool | 346 tokens 313 tokens |
| Claude Sonnet 4.5 | auto, noneany, tool | 346 tokens 313 tokens |
| Claude Sonnet 4 | auto, noneany, tool | 346 tokens 313 tokens |
| Claude Sonnet 3.7 (deprecated) | auto, noneany, tool | 346 tokens 313 tokens |
| Claude Haiku 4.5 | auto, noneany, tool | 346 tokens 313 tokens |
| Claude Haiku 3.5 | auto, noneany, tool | 264 tokens 340 tokens |
| Claude Opus 3 (deprecated) | auto, noneany, tool | 530 tokens 281 tokens |
| Claude Sonnet 3 | auto, noneany, tool | 159 tokens 235 tokens |
| Claude Haiku 3 | auto, noneany, tool | 264 tokens 340 tokens |
Tarification d’outils spécifiques
Outil Bash
The bash tool adds 245 input tokens to your API calls. Additional tokens are consumed by:- Command outputs (stdout/stderr)
- Error messages
- Large file contents
Outil d’exécution de code
Code execution tool usage is tracked separately from token usage. Execution time has a minimum of 5 minutes. If files are included in the request, execution time is billed even if the tool is not used due to files being preloaded onto the container. Each organization receives 50 free hours of usage with the code execution tool per day. Additional usage beyond the first 50 hours is billed at $0.05 per hour, per container.Outil d’éditeur de texte
The text editor tool uses the same pricing structure as other tools used with Claude. It follows the standard input and output token pricing based on the Claude model you’re using. In addition to the base tokens, the following additional input tokens are needed for the text editor tool:| Tool | Additional input tokens |
|---|---|
text_editor_20250429 (Claude 4.x) | 700 tokens |
text_editor_20250124 (Claude Sonnet 3.7 (deprecated)) | 700 tokens |
Outil de recherche web
Web search usage is charged in addition to token usage:Outil de récupération web
Web fetch usage has no additional charges beyond standard token costs:max_content_tokens parameter to set appropriate limits based on your use case and budget considerations.
Example token usage for typical content:
- Average web page (10KB): ~2,500 tokens
- Large documentation page (100KB): ~25,000 tokens
- Research paper PDF (500KB): ~125,000 tokens
Outil d’utilisation d’ordinateur
Computer use follows the standard tool use pricing. When using the computer use tool: System prompt overhead: The computer use beta adds 466-499 tokens to the system prompt Computer use tool token usage:| Model | Input tokens per tool definition |
|---|---|
| Claude 4.x models | 735 tokens |
| Claude Sonnet 3.7 (deprecated) | 735 tokens |
- Screenshot images (see Vision pricing)
- Tool execution results returned to Claude
If you’re also using bash or text editor tools alongside computer use, those tools have their own token costs as documented in their respective pages.
Exemples de tarification pour cas d’usage d’agents
Comprendre la tarification pour les applications d’agents est crucial lors de la construction avec Claude. Ces exemples du monde réel peuvent vous aider à estimer les coûts pour différents modèles d’agents.Exemple d’agent de support client
Lors de la construction d’un agent de support client, voici comment les coûts pourraient se répartir :Exemple de calcul pour traiter 10 000 tickets de support :
- Moyenne d’environ 3 700 tokens par conversation
- Utilisant Claude Sonnet 4.5 à 3/MTok sortie
- Coût total : environ 22,20$ pour 10 000 tickets
Tarification générale des flux de travail d’agents
Pour des architectures d’agents plus complexes avec plusieurs étapes :-
Traitement de requête initial
- Entrée typique : 500-1 000 tokens
- Coût de traitement : environ 0,003$ par requête
-
Récupération de mémoire et de contexte
- Contexte récupéré : 2 000-5 000 tokens
- Coût par récupération : environ 0,015$ par opération
-
Planification et exécution d’actions
- Tokens de planification : 1 000-2 000
- Retour d’exécution : 500-1 000
- Coût combiné : environ 0,045$ par action
Stratégies d’optimisation des coûts
Lors de la construction d’agents avec Claude :- Utilisez les modèles appropriés : Choisissez Haiku pour les tâches simples, Sonnet pour le raisonnement complexe
- Implémentez la mise en cache des prompts : Réduisez les coûts pour le contexte répété
- Opérations par lots : Utilisez l’API Batch pour les tâches non sensibles au temps
- Surveillez les modèles d’utilisation : Suivez la consommation de tokens pour identifier les opportunités d’optimisation
Pour les applications d’agents à haut volume, envisagez de contacter notre équipe de vente entreprise pour des arrangements tarifaires personnalisés.
Considérations tarifaires supplémentaires
Limites de taux
Les limites de taux varient selon le niveau d’utilisation et affectent le nombre de requêtes que vous pouvez faire :- Niveau 1 : Utilisation d’entrée de gamme avec limites de base
- Niveau 2 : Limites augmentées pour les applications en croissance
- Niveau 3 : Limites plus élevées pour les applications établies
- Niveau 4 : Limites standard maximales
- Entreprise : Limites personnalisées disponibles
Remises de volume
Des remises de volume peuvent être disponibles pour les utilisateurs à haut volume. Celles-ci sont négociées au cas par cas.- Les niveaux standard utilisent la tarification indiquée ci-dessus
- Les clients entreprise peuvent contacter les ventes pour une tarification personnalisée
- Des remises académiques et de recherche peuvent être disponibles
Tarification entreprise
Pour les clients entreprise avec des besoins spécifiques :- Limites de taux personnalisées
- Remises de volume
- Support dédié
- Conditions personnalisées
Facturation et paiement
- La facturation est calculée mensuellement basée sur l’utilisation réelle
- Les paiements sont traités en USD
- Options de carte de crédit et de facturation disponibles
- Suivi de l’utilisation disponible dans la Console Claude