Prezzi dei modelli
La seguente tabella mostra i prezzi per tutti i modelli Claude attraverso diversi livelli di utilizzo:| Model | Base Input Tokens | 5m Cache Writes | 1h Cache Writes | Cache Hits & Refreshes | Output Tokens |
|---|---|---|---|---|---|
| Claude Opus 4.1 | $15 / MTok | $18.75 / MTok | $30 / MTok | $1.50 / MTok | $75 / MTok |
| Claude Opus 4 | $15 / MTok | $18.75 / MTok | $30 / MTok | $1.50 / MTok | $75 / MTok |
| Claude Sonnet 4.5 | $3 / MTok | $3.75 / MTok | $6 / MTok | $0.30 / MTok | $15 / MTok |
| Claude Sonnet 4 | $3 / MTok | $3.75 / MTok | $6 / MTok | $0.30 / MTok | $15 / MTok |
| Claude Sonnet 3.7 (deprecated) | $3 / MTok | $3.75 / MTok | $6 / MTok | $0.30 / MTok | $15 / MTok |
| Claude Haiku 4.5 | $1 / MTok | $1.25 / MTok | $2 / MTok | $0.10 / MTok | $5 / MTok |
| Claude Haiku 3.5 | $0.80 / MTok | $1 / MTok | $1.6 / MTok | $0.08 / MTok | $4 / MTok |
| Claude Opus 3 (deprecated) | $15 / MTok | $18.75 / MTok | $30 / MTok | $1.50 / MTok | $75 / MTok |
| Claude Haiku 3 | $0.25 / MTok | $0.30 / MTok | $0.50 / MTok | $0.03 / MTok | $1.25 / MTok |
MTok = Milioni di token. La colonna “Base Input Tokens” mostra i prezzi standard di input, “Cache Writes” e “Cache Hits” sono specifici per il prompt caching, e “Output Tokens” mostra i prezzi di output. Il prompt caching offre durate di cache sia di 5 minuti (predefinita) che di 1 ora per ottimizzare i costi per diversi casi d’uso.La tabella sopra riflette i seguenti moltiplicatori di prezzo per il prompt caching:
- I token di scrittura cache di 5 minuti sono 1,25 volte il prezzo dei token di input base
- I token di scrittura cache di 1 ora sono 2 volte il prezzo dei token di input base
- I token di lettura cache sono 0,1 volte il prezzo dei token di input base
Prezzi delle piattaforme di terze parti
I modelli Claude sono disponibili su AWS Bedrock e Google Vertex AI. Per i prezzi ufficiali, visita:Prezzi degli endpoint regionali per i modelli Claude 4.5 e successiviA partire da Claude Sonnet 4.5 e Haiku 4.5, AWS Bedrock e Google Vertex AI offrono due tipi di endpoint:
- Endpoint globali: Routing dinamico tra regioni per la massima disponibilità
- Endpoint regionali: Routing dei dati garantito all’interno di specifiche regioni geografiche
Prezzi specifici per funzionalità
Elaborazione batch
L’API Batch consente l’elaborazione asincrona di grandi volumi di richieste con uno sconto del 50% sia sui token di input che di output.| Model | Batch input | Batch output |
|---|---|---|
| Claude Opus 4.1 | $7.50 / MTok | $37.50 / MTok |
| Claude Opus 4 | $7.50 / MTok | $37.50 / MTok |
| Claude Sonnet 4.5 | $1.50 / MTok | $7.50 / MTok |
| Claude Sonnet 4 | $1.50 / MTok | $7.50 / MTok |
| Claude Sonnet 3.7 (deprecated) | $1.50 / MTok | $7.50 / MTok |
| Claude Haiku 4.5 | $0.50 / MTok | $2.50 / MTok |
| Claude Haiku 3.5 | $0.40 / MTok | $2 / MTok |
| Claude Opus 3 (deprecated) | $7.50 / MTok | $37.50 / MTok |
| Claude Haiku 3 | $0.125 / MTok | $0.625 / MTok |
Prezzi per contesto lungo
Quando si utilizza Claude Sonnet 4 o Sonnet 4.5 con la finestra di contesto di 1M token abilitata, le richieste che superano i 200K token di input vengono automaticamente addebitate alle tariffe premium per contesto lungo:La finestra di contesto di 1M token è attualmente in beta per le organizzazioni nel livello di utilizzo 4 e le organizzazioni con limiti di velocità personalizzati. La finestra di contesto di 1M token è disponibile solo per Claude Sonnet 4 e Sonnet 4.5.
| ≤ 200K token di input | > 200K token di input |
|---|---|
| Input: $3 / MTok | Input: $6 / MTok |
| Output: $15 / MTok | Output: $22.50 / MTok |
- Lo sconto del 50% dell’API Batch si applica ai prezzi per contesto lungo
- I moltiplicatori del prompt caching si applicano sopra i prezzi per contesto lungo
Anche con il flag beta abilitato, le richieste con meno di 200K token di input vengono addebitate alle tariffe standard. Se la tua richiesta supera i 200K token di input, tutti i token incorrono in prezzi premium.La soglia di 200K è basata esclusivamente sui token di input (incluse letture/scritture cache). Il conteggio dei token di output non influisce sulla selezione del livello di prezzo, anche se i token di output vengono addebitati alla tariffa più alta quando la soglia di input viene superata.
usage nella risposta API:
input_tokenscache_creation_input_tokens(se si utilizza il prompt caching)cache_read_input_tokens(se si utilizza il prompt caching)
usage, consulta la documentazione della risposta API.
Prezzi per l’uso degli strumenti
Tool use requests are priced based on:- The total number of input tokens sent to the model (including in the
toolsparameter) - The number of output tokens generated
- For server-side tools, additional usage-based pricing (e.g., web search charges per search performed)
- The
toolsparameter in API requests (tool names, descriptions, and schemas) tool_usecontent blocks in API requests and responsestool_resultcontent blocks in API requests
tools, we also automatically include a special system prompt for the model which enables tool use. The number of tool use tokens required for each model are listed below (excluding the additional tokens listed above). Note that the table assumes at least 1 tool is provided. If no tools are provided, then a tool choice of none uses 0 additional system prompt tokens.
| Model | Tool choice | Tool use system prompt token count |
|---|---|---|
| Claude Opus 4.1 | auto, noneany, tool | 346 tokens 313 tokens |
| Claude Opus 4 | auto, noneany, tool | 346 tokens 313 tokens |
| Claude Sonnet 4.5 | auto, noneany, tool | 346 tokens 313 tokens |
| Claude Sonnet 4 | auto, noneany, tool | 346 tokens 313 tokens |
| Claude Sonnet 3.7 (deprecated) | auto, noneany, tool | 346 tokens 313 tokens |
| Claude Haiku 4.5 | auto, noneany, tool | 346 tokens 313 tokens |
| Claude Haiku 3.5 | auto, noneany, tool | 264 tokens 340 tokens |
| Claude Opus 3 (deprecated) | auto, noneany, tool | 530 tokens 281 tokens |
| Claude Sonnet 3 | auto, noneany, tool | 159 tokens 235 tokens |
| Claude Haiku 3 | auto, noneany, tool | 264 tokens 340 tokens |
Prezzi specifici degli strumenti
Strumento Bash
The bash tool adds 245 input tokens to your API calls. Additional tokens are consumed by:- Command outputs (stdout/stderr)
- Error messages
- Large file contents
Strumento di esecuzione codice
Code execution tool usage is tracked separately from token usage. Execution time has a minimum of 5 minutes. If files are included in the request, execution time is billed even if the tool is not used due to files being preloaded onto the container. Each organization receives 50 free hours of usage with the code execution tool per day. Additional usage beyond the first 50 hours is billed at $0.05 per hour, per container.Strumento editor di testo
The text editor tool uses the same pricing structure as other tools used with Claude. It follows the standard input and output token pricing based on the Claude model you’re using. In addition to the base tokens, the following additional input tokens are needed for the text editor tool:| Tool | Additional input tokens |
|---|---|
text_editor_20250429 (Claude 4.x) | 700 tokens |
text_editor_20250124 (Claude Sonnet 3.7 (deprecated)) | 700 tokens |
Strumento di ricerca web
Web search usage is charged in addition to token usage:Strumento di recupero web
Web fetch usage has no additional charges beyond standard token costs:max_content_tokens parameter to set appropriate limits based on your use case and budget considerations.
Example token usage for typical content:
- Average web page (10KB): ~2,500 tokens
- Large documentation page (100KB): ~25,000 tokens
- Research paper PDF (500KB): ~125,000 tokens
Strumento di uso del computer
Computer use follows the standard tool use pricing. When using the computer use tool: System prompt overhead: The computer use beta adds 466-499 tokens to the system prompt Computer use tool token usage:| Model | Input tokens per tool definition |
|---|---|
| Claude 4.x models | 735 tokens |
| Claude Sonnet 3.7 (deprecated) | 735 tokens |
- Screenshot images (see Vision pricing)
- Tool execution results returned to Claude
If you’re also using bash or text editor tools alongside computer use, those tools have their own token costs as documented in their respective pages.
Esempi di prezzi per casi d’uso di agenti
Comprendere i prezzi per le applicazioni di agenti è cruciale quando si costruisce con Claude. Questi esempi del mondo reale possono aiutarti a stimare i costi per diversi modelli di agenti.Esempio di agente di supporto clienti
Quando si costruisce un agente di supporto clienti, ecco come potrebbero suddividersi i costi:Calcolo di esempio per l’elaborazione di 10.000 ticket di supporto:
- Media di ~3.700 token per conversazione
- Utilizzando Claude Sonnet 4.5 a 15/MTok output
- Costo totale: ~$22.20 per 10.000 ticket
Prezzi generali del flusso di lavoro degli agenti
Per architetture di agenti più complesse con più passaggi:-
Elaborazione della richiesta iniziale
- Input tipico: 500-1.000 token
- Costo di elaborazione: ~$0.003 per richiesta
-
Recupero di memoria e contesto
- Contesto recuperato: 2.000-5.000 token
- Costo per recupero: ~$0.015 per operazione
-
Pianificazione ed esecuzione dell’azione
- Token di pianificazione: 1.000-2.000
- Feedback di esecuzione: 500-1.000
- Costo combinato: ~$0.045 per azione
Strategie di ottimizzazione dei costi
Quando si costruiscono agenti con Claude:- Usa modelli appropriati: Scegli Haiku per compiti semplici, Sonnet per ragionamento complesso
- Implementa il prompt caching: Riduci i costi per contesto ripetuto
- Operazioni batch: Usa l’API Batch per compiti non sensibili al tempo
- Monitora i modelli di utilizzo: Traccia il consumo di token per identificare opportunità di ottimizzazione
Per applicazioni di agenti ad alto volume, considera di contattare il nostro team vendite enterprise per accordi di prezzo personalizzati.
Considerazioni aggiuntive sui prezzi
Limiti di velocità
I limiti di velocità variano per livello di utilizzo e influenzano quante richieste puoi fare:- Livello 1: Utilizzo di livello base con limiti di base
- Livello 2: Limiti aumentati per applicazioni in crescita
- Livello 3: Limiti più alti per applicazioni consolidate
- Livello 4: Limiti standard massimi
- Enterprise: Limiti personalizzati disponibili
Sconti per volume
Sconti per volume potrebbero essere disponibili per utenti ad alto volume. Questi vengono negoziati caso per caso.- I livelli standard utilizzano i prezzi mostrati sopra
- I clienti enterprise possono contattare le vendite per prezzi personalizzati
- Sconti accademici e di ricerca potrebbero essere disponibili
Prezzi enterprise
Per clienti enterprise con esigenze specifiche:- Limiti di velocità personalizzati
- Sconti per volume
- Supporto dedicato
- Termini personalizzati
Fatturazione e pagamento
- La fatturazione viene calcolata mensilmente basata sull’utilizzo effettivo
- I pagamenti vengono elaborati in USD
- Opzioni di carta di credito e fatturazione disponibili
- Tracciamento dell’utilizzo disponibile nella Console Claude