Tarification

Cette page fournit des informations détaillées sur la tarification des modèles et fonctionnalités d’Anthropic. Tous les prix sont en USD. Pour les informations tarifaires les plus récentes, veuillez visiter claude.com/pricing.

Tarification des modèles

Le tableau suivant présente la tarification de tous les modèles Claude selon différents niveaux d’utilisation :

Model	Base Input Tokens	5m Cache Writes	1h Cache Writes	Cache Hits & Refreshes	Output Tokens
Claude Opus 4.1	$15 / MTok	$18.75 / MTok	$30 / MTok	$1.50 / MTok	$75 / MTok
Claude Opus 4	$15 / MTok	$18.75 / MTok	$30 / MTok	$1.50 / MTok	$75 / MTok
Claude Sonnet 4.5	$3 / MTok	$3.75 / MTok	$6 / MTok	$0.30 / MTok	$15 / MTok
Claude Sonnet 4	$3 / MTok	$3.75 / MTok	$6 / MTok	$0.30 / MTok	$15 / MTok
Claude Sonnet 3.7 (deprecated)	$3 / MTok	$3.75 / MTok	$6 / MTok	$0.30 / MTok	$15 / MTok
Claude Haiku 4.5	$1 / MTok	$1.25 / MTok	$2 / MTok	$0.10 / MTok	$5 / MTok
Claude Haiku 3.5	$0.80 / MTok	$1 / MTok	$1.6 / MTok	$0.08 / MTok	$4 / MTok
Claude Opus 3 (deprecated)	$15 / MTok	$18.75 / MTok	$30 / MTok	$1.50 / MTok	$75 / MTok
Claude Haiku 3	$0.25 / MTok	$0.30 / MTok	$0.50 / MTok	$0.03 / MTok	$1.25 / MTok

MTok = Million de tokens. La colonne “Base Input Tokens” indique la tarification standard d’entrée, “Cache Writes” et “Cache Hits” sont spécifiques à la mise en cache des prompts, et “Output Tokens” indique la tarification de sortie. La mise en cache des prompts offre des durées de cache de 5 minutes (par défaut) et 1 heure pour optimiser les coûts selon différents cas d’usage.Le tableau ci-dessus reflète les multiplicateurs de tarification suivants pour la mise en cache des prompts :

Les tokens d’écriture de cache de 5 minutes coûtent 1,25 fois le prix des tokens d’entrée de base
Les tokens d’écriture de cache de 1 heure coûtent 2 fois le prix des tokens d’entrée de base
Les tokens de lecture de cache coûtent 0,1 fois le prix des tokens d’entrée de base

Tarification des plateformes tierces

Les modèles Claude sont disponibles sur AWS Bedrock et Google Vertex AI. Pour la tarification officielle, visitez :

Tarification des points de terminaison régionaux pour les modèles Claude 4.5 et ultérieursÀ partir de Claude Sonnet 4.5 et Haiku 4.5, AWS Bedrock et Google Vertex AI offrent deux types de points de terminaison :

Points de terminaison globaux : Routage dynamique entre régions pour une disponibilité maximale
Points de terminaison régionaux : Routage des données garanti dans des régions géographiques spécifiques

Les points de terminaison régionaux incluent une prime de 10% par rapport aux points de terminaison globaux. L’API Claude (1P) est globale par défaut et n’est pas affectée par ce changement. L’API Claude est uniquement globale (équivalente à l’offre et à la tarification des points de terminaison globaux d’autres fournisseurs).Portée : Cette structure tarifaire s’applique à Claude Sonnet 4.5, Haiku 4.5, et tous les modèles futurs. Les modèles antérieurs (Claude Sonnet 4, Opus 4, et versions précédentes) conservent leur tarification existante.Pour les détails d’implémentation et exemples de code :

Tarification spécifique aux fonctionnalités

Traitement par lots

L’API Batch permet le traitement asynchrone de gros volumes de requêtes avec une remise de 50% sur les tokens d’entrée et de sortie.

Model	Batch input	Batch output
Claude Opus 4.1	$7.50 / MTok	$37.50 / MTok
Claude Opus 4	$7.50 / MTok	$37.50 / MTok
Claude Sonnet 4.5	$1.50 / MTok	$7.50 / MTok
Claude Sonnet 4	$1.50 / MTok	$7.50 / MTok
Claude Sonnet 3.7 (deprecated)	$1.50 / MTok	$7.50 / MTok
Claude Haiku 4.5	$0.50 / MTok	$2.50 / MTok
Claude Haiku 3.5	$0.40 / MTok	$2 / MTok
Claude Opus 3 (deprecated)	$7.50 / MTok	$37.50 / MTok
Claude Haiku 3	$0.125 / MTok	$0.625 / MTok

Pour plus d’informations sur le traitement par lots, consultez notre documentation sur le traitement par lots.

Tarification du contexte long

Lors de l’utilisation de Claude Sonnet 4 ou Sonnet 4.5 avec la fenêtre de contexte de 1M tokens activée, les requêtes qui dépassent 200K tokens d’entrée sont automatiquement facturées aux tarifs premium de contexte long :

La fenêtre de contexte de 1M tokens est actuellement en bêta pour les organisations du niveau d’utilisation 4 et les organisations avec des limites de taux personnalisées. La fenêtre de contexte de 1M tokens n’est disponible que pour Claude Sonnet 4 et Sonnet 4.5.

≤ 200K tokens d’entrée	> 200K tokens d’entrée
Entrée : 3 $ / MTok	Entrée : 6 $ / MTok
Sortie : 15 $ / MTok	Sortie : 22,50 $ / MTok

La tarification du contexte long se cumule avec d’autres modificateurs de tarification :

La remise de 50% de l’API Batch s’applique à la tarification du contexte long
Les multiplicateurs de mise en cache des prompts s’appliquent en plus de la tarification du contexte long

Même avec le flag bêta activé, les requêtes avec moins de 200K tokens d’entrée sont facturées aux tarifs standard. Si votre requête dépasse 200K tokens d’entrée, tous les tokens encourent la tarification premium.Le seuil de 200K est basé uniquement sur les tokens d’entrée (incluant les lectures/écritures de cache). Le nombre de tokens de sortie n’affecte pas la sélection du niveau tarifaire, bien que les tokens de sortie soient facturés au tarif plus élevé lorsque le seuil d’entrée est dépassé.

Pour vérifier si votre requête API a été facturée aux tarifs de la fenêtre de contexte de 1M, examinez l’objet usage dans la réponse API :

{
  "usage": {
    "input_tokens": 250000,
    "cache_creation_input_tokens": 0,
    "cache_read_input_tokens": 0,
    "output_tokens": 500
  }
}

Calculez le total des tokens d’entrée en additionnant :

input_tokens
cache_creation_input_tokens (si vous utilisez la mise en cache des prompts)
cache_read_input_tokens (si vous utilisez la mise en cache des prompts)

Si le total dépasse 200 000 tokens, l’ensemble de la requête a été facturé aux tarifs de contexte 1M. Pour plus d’informations sur l’objet usage, consultez la documentation de réponse API.

Tarification de l’utilisation d’outils

Tool use requests are priced based on:

The total number of input tokens sent to the model (including in the tools parameter)
The number of output tokens generated
For server-side tools, additional usage-based pricing (e.g., web search charges per search performed)

Client-side tools are priced the same as any other Claude API request, while server-side tools may incur additional charges based on their specific usage. The additional tokens from tool use come from:

The tools parameter in API requests (tool names, descriptions, and schemas)
tool_use content blocks in API requests and responses
tool_result content blocks in API requests

When you use tools, we also automatically include a special system prompt for the model which enables tool use. The number of tool use tokens required for each model are listed below (excluding the additional tokens listed above). Note that the table assumes at least 1 tool is provided. If no tools are provided, then a tool choice of none uses 0 additional system prompt tokens.

Model	Tool choice	Tool use system prompt token count
Claude Opus 4.1	`auto`, `none` `any`, `tool`	346 tokens 313 tokens
Claude Opus 4	`auto`, `none` `any`, `tool`	346 tokens 313 tokens
Claude Sonnet 4.5	`auto`, `none` `any`, `tool`	346 tokens 313 tokens
Claude Sonnet 4	`auto`, `none` `any`, `tool`	346 tokens 313 tokens
Claude Sonnet 3.7 (deprecated)	`auto`, `none` `any`, `tool`	346 tokens 313 tokens
Claude Haiku 4.5	`auto`, `none` `any`, `tool`	346 tokens 313 tokens
Claude Haiku 3.5	`auto`, `none` `any`, `tool`	264 tokens 340 tokens
Claude Opus 3 (deprecated)	`auto`, `none` `any`, `tool`	530 tokens 281 tokens
Claude Sonnet 3	`auto`, `none` `any`, `tool`	159 tokens 235 tokens
Claude Haiku 3	`auto`, `none` `any`, `tool`	264 tokens 340 tokens

These token counts are added to your normal input and output tokens to calculate the total cost of a request. Pour les prix actuels par modèle, référez-vous à notre section tarification des modèles ci-dessus. Pour plus d’informations sur l’implémentation de l’utilisation d’outils et les meilleures pratiques, consultez notre documentation sur l’utilisation d’outils.

Tarification d’outils spécifiques

Outil Bash

The bash tool adds 245 input tokens to your API calls. Additional tokens are consumed by:

Command outputs (stdout/stderr)
Error messages
Large file contents

Voir tarification de l’utilisation d’outils pour les détails complets de tarification.

Outil d’exécution de code

Code execution tool usage is tracked separately from token usage. Execution time has a minimum of 5 minutes. If files are included in the request, execution time is billed even if the tool is not used due to files being preloaded onto the container. Each organization receives 50 free hours of usage with the code execution tool per day. Additional usage beyond the first 50 hours is billed at $0.05 per hour, per container.

Outil d’éditeur de texte

The text editor tool uses the same pricing structure as other tools used with Claude. It follows the standard input and output token pricing based on the Claude model you’re using. In addition to the base tokens, the following additional input tokens are needed for the text editor tool:

Tool	Additional input tokens
`text_editor_20250429` (Claude 4.x)	700 tokens
`text_editor_20250124` (Claude Sonnet 3.7 (deprecated))	700 tokens

Voir tarification de l’utilisation d’outils pour les détails complets de tarification.

Outil de recherche web

Web search usage is charged in addition to token usage:

"usage": {
  "input_tokens": 105,
  "output_tokens": 6039,
  "cache_read_input_tokens": 7123,
  "cache_creation_input_tokens": 7345,
  "server_tool_use": {
    "web_search_requests": 1
  }
}

Web search is available on the Claude API for $10 per 1,000 searches, plus standard token costs for search-generated content. Web search results retrieved throughout a conversation are counted as input tokens, in search iterations executed during a single turn and in subsequent conversation turns. Each web search counts as one use, regardless of the number of results returned. If an error occurs during web search, the web search will not be billed.

Outil de récupération web

Web fetch usage has no additional charges beyond standard token costs:

"usage": {
  "input_tokens": 25039,
  "output_tokens": 931,
  "cache_read_input_tokens": 0,
  "cache_creation_input_tokens": 0,
  "server_tool_use": {
    "web_fetch_requests": 1
  }
}

The web fetch tool is available on the Claude API at no additional cost. You only pay standard token costs for the fetched content that becomes part of your conversation context. To protect against inadvertently fetching large content that would consume excessive tokens, use the max_content_tokens parameter to set appropriate limits based on your use case and budget considerations. Example token usage for typical content:

Average web page (10KB): ~2,500 tokens
Large documentation page (100KB): ~25,000 tokens
Research paper PDF (500KB): ~125,000 tokens

Outil d’utilisation d’ordinateur

Computer use follows the standard tool use pricing. When using the computer use tool: System prompt overhead: The computer use beta adds 466-499 tokens to the system prompt Computer use tool token usage:

Model	Input tokens per tool definition
Claude 4.x models	735 tokens
Claude Sonnet 3.7 (deprecated)	735 tokens

Additional token consumption:

Screenshot images (see Vision pricing)
Tool execution results returned to Claude

If you’re also using bash or text editor tools alongside computer use, those tools have their own token costs as documented in their respective pages.

Exemples de tarification pour cas d’usage d’agents

Comprendre la tarification pour les applications d’agents est crucial lors de la construction avec Claude. Ces exemples du monde réel peuvent vous aider à estimer les coûts pour différents modèles d’agents.

Exemple d’agent de support client

Lors de la construction d’un agent de support client, voici comment les coûts pourraient se répartir :

Exemple de calcul pour traiter 10 000 tickets de support :

Moyenne d’environ 3 700 tokens par conversation
Utilisant Claude Sonnet 4.5 à 3 $/MTok entrée, 15$ /MTok sortie
Coût total : environ 22,20$ pour 10 000 tickets

Pour une présentation détaillée de ce calcul, consultez notre guide d’agent de support client.

Tarification générale des flux de travail d’agents

Pour des architectures d’agents plus complexes avec plusieurs étapes :

Traitement de requête initial
- Entrée typique : 500-1 000 tokens
- Coût de traitement : environ 0,003$ par requête
Récupération de mémoire et de contexte
- Contexte récupéré : 2 000-5 000 tokens
- Coût par récupération : environ 0,015$ par opération
Planification et exécution d’actions
- Tokens de planification : 1 000-2 000
- Retour d’exécution : 500-1 000
- Coût combiné : environ 0,045$ par action

Pour un guide complet sur les modèles de tarification d’agents, consultez notre guide des cas d’usage d’agents.

Stratégies d’optimisation des coûts

Lors de la construction d’agents avec Claude :

Utilisez les modèles appropriés : Choisissez Haiku pour les tâches simples, Sonnet pour le raisonnement complexe
Implémentez la mise en cache des prompts : Réduisez les coûts pour le contexte répété
Opérations par lots : Utilisez l’API Batch pour les tâches non sensibles au temps
Surveillez les modèles d’utilisation : Suivez la consommation de tokens pour identifier les opportunités d’optimisation

Pour les applications d’agents à haut volume, envisagez de contacter notre équipe de vente entreprise pour des arrangements tarifaires personnalisés.

Considérations tarifaires supplémentaires

Limites de taux

Les limites de taux varient selon le niveau d’utilisation et affectent le nombre de requêtes que vous pouvez faire :

Niveau 1 : Utilisation d’entrée de gamme avec limites de base
Niveau 2 : Limites augmentées pour les applications en croissance
Niveau 3 : Limites plus élevées pour les applications établies
Niveau 4 : Limites standard maximales
Entreprise : Limites personnalisées disponibles

Pour des informations détaillées sur les limites de taux, consultez notre documentation sur les limites de taux. Pour des limites de taux plus élevées ou des arrangements tarifaires personnalisés, contactez notre équipe de vente.

Remises de volume

Des remises de volume peuvent être disponibles pour les utilisateurs à haut volume. Celles-ci sont négociées au cas par cas.

Les niveaux standard utilisent la tarification indiquée ci-dessus
Les clients entreprise peuvent contacter les ventes pour une tarification personnalisée
Des remises académiques et de recherche peuvent être disponibles

Tarification entreprise

Pour les clients entreprise avec des besoins spécifiques :

Limites de taux personnalisées
Remises de volume
Support dédié
Conditions personnalisées

Contactez notre équipe de vente à [email protected] ou via la Console Claude pour discuter des options de tarification entreprise.

Facturation et paiement

La facturation est calculée mensuellement basée sur l’utilisation réelle
Les paiements sont traités en USD
Options de carte de crédit et de facturation disponibles
Suivi de l’utilisation disponible dans la Console Claude

Questions fréquemment posées

Comment l’utilisation de tokens est-elle calculée ? Les tokens sont des morceaux de texte que les modèles traitent. Comme estimation approximative, 1 token représente environ 4 caractères ou 0,75 mots en anglais. Le compte exact varie selon la langue et le type de contenu. Y a-t-il des niveaux gratuits ou des essais ? Les nouveaux utilisateurs reçoivent une petite quantité de crédits gratuits pour tester l’API. Contactez les ventes pour des informations sur les essais étendus pour l’évaluation entreprise. Comment les remises se cumulent-elles ? Les remises de l’API Batch et de la mise en cache des prompts peuvent être combinées. Par exemple, utiliser les deux fonctionnalités ensemble fournit des économies de coûts significatives comparé aux appels API standard. Quels modes de paiement sont acceptés ? Nous acceptons les principales cartes de crédit pour les comptes standard. Les clients entreprise peuvent organiser la facturation et d’autres modes de paiement. Pour des questions supplémentaires sur la tarification, contactez [email protected].

Premiers pas

Modèles et tarification

Créer avec Claude

Capacités

Outils

Compétences de l'Agent

SDK Agent

MCP dans l'API

Claude sur les plateformes tierces

Ingénierie des prompts

Tester et évaluer

Renforcer les garde-fous

Tarification des modèles

Tarification des plateformes tierces

Tarification spécifique aux fonctionnalités

Traitement par lots

Tarification du contexte long

Tarification de l’utilisation d’outils

Tarification d’outils spécifiques

Outil Bash

Outil d’exécution de code

Outil d’éditeur de texte

Outil de recherche web

Outil de récupération web

Outil d’utilisation d’ordinateur

Exemples de tarification pour cas d’usage d’agents

Exemple d’agent de support client

Tarification générale des flux de travail d’agents

Stratégies d’optimisation des coûts

Considérations tarifaires supplémentaires

Limites de taux

Remises de volume

Tarification entreprise

Facturation et paiement

Questions fréquemment posées

Premiers pas

Modèles et tarification

Créer avec Claude

Capacités

Outils

Compétences de l'Agent

SDK Agent

MCP dans l'API

Claude sur les plateformes tierces

Ingénierie des prompts

Tester et évaluer

Renforcer les garde-fous

​Tarification des modèles

​Tarification des plateformes tierces

​Tarification spécifique aux fonctionnalités

​Traitement par lots

​Tarification du contexte long

​Tarification de l’utilisation d’outils

​Tarification d’outils spécifiques

​Outil Bash

​Outil d’exécution de code

​Outil d’éditeur de texte

​Outil de recherche web

​Outil de récupération web

​Outil d’utilisation d’ordinateur

​Exemples de tarification pour cas d’usage d’agents

​Exemple d’agent de support client

​Tarification générale des flux de travail d’agents

​Stratégies d’optimisation des coûts

​Considérations tarifaires supplémentaires

​Limites de taux

​Remises de volume

​Tarification entreprise

​Facturation et paiement

​Questions fréquemment posées

Tarification des modèles

Tarification des plateformes tierces

Tarification spécifique aux fonctionnalités

Traitement par lots

Tarification du contexte long

Tarification de l’utilisation d’outils

Tarification d’outils spécifiques

Outil Bash

Outil d’exécution de code

Outil d’éditeur de texte

Outil de recherche web

Outil de récupération web

Outil d’utilisation d’ordinateur

Exemples de tarification pour cas d’usage d’agents

Exemple d’agent de support client

Tarification générale des flux de travail d’agents

Stratégies d’optimisation des coûts

Considérations tarifaires supplémentaires

Limites de taux

Remises de volume

Tarification entreprise

Facturation et paiement

Questions fréquemment posées