Prezzi

Questa pagina fornisce informazioni dettagliate sui prezzi per i modelli e le funzionalità di Anthropic. Tutti i prezzi sono in USD. Per le informazioni sui prezzi più aggiornate, visita claude.com/pricing.

Prezzi dei modelli

La seguente tabella mostra i prezzi per tutti i modelli Claude attraverso diversi livelli di utilizzo:

Model	Base Input Tokens	5m Cache Writes	1h Cache Writes	Cache Hits & Refreshes	Output Tokens
Claude Opus 4.1	$15 / MTok	$18.75 / MTok	$30 / MTok	$1.50 / MTok	$75 / MTok
Claude Opus 4	$15 / MTok	$18.75 / MTok	$30 / MTok	$1.50 / MTok	$75 / MTok
Claude Sonnet 4.5	$3 / MTok	$3.75 / MTok	$6 / MTok	$0.30 / MTok	$15 / MTok
Claude Sonnet 4	$3 / MTok	$3.75 / MTok	$6 / MTok	$0.30 / MTok	$15 / MTok
Claude Sonnet 3.7 (deprecated)	$3 / MTok	$3.75 / MTok	$6 / MTok	$0.30 / MTok	$15 / MTok
Claude Haiku 4.5	$1 / MTok	$1.25 / MTok	$2 / MTok	$0.10 / MTok	$5 / MTok
Claude Haiku 3.5	$0.80 / MTok	$1 / MTok	$1.6 / MTok	$0.08 / MTok	$4 / MTok
Claude Opus 3 (deprecated)	$15 / MTok	$18.75 / MTok	$30 / MTok	$1.50 / MTok	$75 / MTok
Claude Haiku 3	$0.25 / MTok	$0.30 / MTok	$0.50 / MTok	$0.03 / MTok	$1.25 / MTok

MTok = Milioni di token. La colonna “Base Input Tokens” mostra i prezzi standard di input, “Cache Writes” e “Cache Hits” sono specifici per il prompt caching, e “Output Tokens” mostra i prezzi di output. Il prompt caching offre durate di cache sia di 5 minuti (predefinita) che di 1 ora per ottimizzare i costi per diversi casi d’uso.La tabella sopra riflette i seguenti moltiplicatori di prezzo per il prompt caching:

I token di scrittura cache di 5 minuti sono 1,25 volte il prezzo dei token di input base
I token di scrittura cache di 1 ora sono 2 volte il prezzo dei token di input base
I token di lettura cache sono 0,1 volte il prezzo dei token di input base

Prezzi delle piattaforme di terze parti

I modelli Claude sono disponibili su AWS Bedrock e Google Vertex AI. Per i prezzi ufficiali, visita:

Prezzi degli endpoint regionali per i modelli Claude 4.5 e successiviA partire da Claude Sonnet 4.5 e Haiku 4.5, AWS Bedrock e Google Vertex AI offrono due tipi di endpoint:

Endpoint globali: Routing dinamico tra regioni per la massima disponibilità
Endpoint regionali: Routing dei dati garantito all’interno di specifiche regioni geografiche

Gli endpoint regionali includono un premio del 10% rispetto agli endpoint globali. L’API Claude (1P) è globale per impostazione predefinita e non è influenzata da questo cambiamento. L’API Claude è solo globale (equivalente all’offerta e ai prezzi degli endpoint globali di altri fornitori).Ambito: Questa struttura dei prezzi si applica a Claude Sonnet 4.5, Haiku 4.5 e tutti i modelli futuri. I modelli precedenti (Claude Sonnet 4, Opus 4 e versioni precedenti) mantengono i loro prezzi esistenti.Per dettagli di implementazione ed esempi di codice:

Prezzi specifici per funzionalità

Elaborazione batch

L’API Batch consente l’elaborazione asincrona di grandi volumi di richieste con uno sconto del 50% sia sui token di input che di output.

Model	Batch input	Batch output
Claude Opus 4.1	$7.50 / MTok	$37.50 / MTok
Claude Opus 4	$7.50 / MTok	$37.50 / MTok
Claude Sonnet 4.5	$1.50 / MTok	$7.50 / MTok
Claude Sonnet 4	$1.50 / MTok	$7.50 / MTok
Claude Sonnet 3.7 (deprecated)	$1.50 / MTok	$7.50 / MTok
Claude Haiku 4.5	$0.50 / MTok	$2.50 / MTok
Claude Haiku 3.5	$0.40 / MTok	$2 / MTok
Claude Opus 3 (deprecated)	$7.50 / MTok	$37.50 / MTok
Claude Haiku 3	$0.125 / MTok	$0.625 / MTok

Per maggiori informazioni sull’elaborazione batch, consulta la nostra documentazione sull’elaborazione batch.

Prezzi per contesto lungo

Quando si utilizza Claude Sonnet 4 o Sonnet 4.5 con la finestra di contesto di 1M token abilitata, le richieste che superano i 200K token di input vengono automaticamente addebitate alle tariffe premium per contesto lungo:

La finestra di contesto di 1M token è attualmente in beta per le organizzazioni nel livello di utilizzo 4 e le organizzazioni con limiti di velocità personalizzati. La finestra di contesto di 1M token è disponibile solo per Claude Sonnet 4 e Sonnet 4.5.

≤ 200K token di input	> 200K token di input
Input: $3 / MTok	Input: $6 / MTok
Output: $15 / MTok	Output: $22.50 / MTok

I prezzi per contesto lungo si sommano con altri modificatori di prezzo:

Lo sconto del 50% dell’API Batch si applica ai prezzi per contesto lungo
I moltiplicatori del prompt caching si applicano sopra i prezzi per contesto lungo

Anche con il flag beta abilitato, le richieste con meno di 200K token di input vengono addebitate alle tariffe standard. Se la tua richiesta supera i 200K token di input, tutti i token incorrono in prezzi premium.La soglia di 200K è basata esclusivamente sui token di input (incluse letture/scritture cache). Il conteggio dei token di output non influisce sulla selezione del livello di prezzo, anche se i token di output vengono addebitati alla tariffa più alta quando la soglia di input viene superata.

Per verificare se la tua richiesta API è stata addebitata alle tariffe della finestra di contesto di 1M, esamina l’oggetto usage nella risposta API:

{
  "usage": {
    "input_tokens": 250000,
    "cache_creation_input_tokens": 0,
    "cache_read_input_tokens": 0,
    "output_tokens": 500
  }
}

Calcola il totale dei token di input sommando:

input_tokens
cache_creation_input_tokens (se si utilizza il prompt caching)
cache_read_input_tokens (se si utilizza il prompt caching)

Se il totale supera i 200.000 token, l’intera richiesta è stata fatturata alle tariffe del contesto di 1M. Per maggiori informazioni sull’oggetto usage, consulta la documentazione della risposta API.

Prezzi per l’uso degli strumenti

Tool use requests are priced based on:

The total number of input tokens sent to the model (including in the tools parameter)
The number of output tokens generated
For server-side tools, additional usage-based pricing (e.g., web search charges per search performed)

Client-side tools are priced the same as any other Claude API request, while server-side tools may incur additional charges based on their specific usage. The additional tokens from tool use come from:

The tools parameter in API requests (tool names, descriptions, and schemas)
tool_use content blocks in API requests and responses
tool_result content blocks in API requests

When you use tools, we also automatically include a special system prompt for the model which enables tool use. The number of tool use tokens required for each model are listed below (excluding the additional tokens listed above). Note that the table assumes at least 1 tool is provided. If no tools are provided, then a tool choice of none uses 0 additional system prompt tokens.

Model	Tool choice	Tool use system prompt token count
Claude Opus 4.1	`auto`, `none` `any`, `tool`	346 tokens 313 tokens
Claude Opus 4	`auto`, `none` `any`, `tool`	346 tokens 313 tokens
Claude Sonnet 4.5	`auto`, `none` `any`, `tool`	346 tokens 313 tokens
Claude Sonnet 4	`auto`, `none` `any`, `tool`	346 tokens 313 tokens
Claude Sonnet 3.7 (deprecated)	`auto`, `none` `any`, `tool`	346 tokens 313 tokens
Claude Haiku 4.5	`auto`, `none` `any`, `tool`	346 tokens 313 tokens
Claude Haiku 3.5	`auto`, `none` `any`, `tool`	264 tokens 340 tokens
Claude Opus 3 (deprecated)	`auto`, `none` `any`, `tool`	530 tokens 281 tokens
Claude Sonnet 3	`auto`, `none` `any`, `tool`	159 tokens 235 tokens
Claude Haiku 3	`auto`, `none` `any`, `tool`	264 tokens 340 tokens

These token counts are added to your normal input and output tokens to calculate the total cost of a request. Per i prezzi attuali per modello, fai riferimento alla nostra sezione prezzi dei modelli sopra. Per maggiori informazioni sull’implementazione dell’uso degli strumenti e le migliori pratiche, consulta la nostra documentazione sull’uso degli strumenti.

Prezzi specifici degli strumenti

Strumento Bash

The bash tool adds 245 input tokens to your API calls. Additional tokens are consumed by:

Command outputs (stdout/stderr)
Error messages
Large file contents

Consulta i prezzi per l’uso degli strumenti per dettagli completi sui prezzi.

Strumento di esecuzione codice

Code execution tool usage is tracked separately from token usage. Execution time has a minimum of 5 minutes. If files are included in the request, execution time is billed even if the tool is not used due to files being preloaded onto the container. Each organization receives 50 free hours of usage with the code execution tool per day. Additional usage beyond the first 50 hours is billed at $0.05 per hour, per container.

Strumento editor di testo

The text editor tool uses the same pricing structure as other tools used with Claude. It follows the standard input and output token pricing based on the Claude model you’re using. In addition to the base tokens, the following additional input tokens are needed for the text editor tool:

Tool	Additional input tokens
`text_editor_20250429` (Claude 4.x)	700 tokens
`text_editor_20250124` (Claude Sonnet 3.7 (deprecated))	700 tokens

Consulta i prezzi per l’uso degli strumenti per dettagli completi sui prezzi.

Strumento di ricerca web

Web search usage is charged in addition to token usage:

"usage": {
  "input_tokens": 105,
  "output_tokens": 6039,
  "cache_read_input_tokens": 7123,
  "cache_creation_input_tokens": 7345,
  "server_tool_use": {
    "web_search_requests": 1
  }
}

Web search is available on the Claude API for $10 per 1,000 searches, plus standard token costs for search-generated content. Web search results retrieved throughout a conversation are counted as input tokens, in search iterations executed during a single turn and in subsequent conversation turns. Each web search counts as one use, regardless of the number of results returned. If an error occurs during web search, the web search will not be billed.

Strumento di recupero web

Web fetch usage has no additional charges beyond standard token costs:

"usage": {
  "input_tokens": 25039,
  "output_tokens": 931,
  "cache_read_input_tokens": 0,
  "cache_creation_input_tokens": 0,
  "server_tool_use": {
    "web_fetch_requests": 1
  }
}

The web fetch tool is available on the Claude API at no additional cost. You only pay standard token costs for the fetched content that becomes part of your conversation context. To protect against inadvertently fetching large content that would consume excessive tokens, use the max_content_tokens parameter to set appropriate limits based on your use case and budget considerations. Example token usage for typical content:

Average web page (10KB): ~2,500 tokens
Large documentation page (100KB): ~25,000 tokens
Research paper PDF (500KB): ~125,000 tokens

Strumento di uso del computer

Computer use follows the standard tool use pricing. When using the computer use tool: System prompt overhead: The computer use beta adds 466-499 tokens to the system prompt Computer use tool token usage:

Model	Input tokens per tool definition
Claude 4.x models	735 tokens
Claude Sonnet 3.7 (deprecated)	735 tokens

Additional token consumption:

Screenshot images (see Vision pricing)
Tool execution results returned to Claude

If you’re also using bash or text editor tools alongside computer use, those tools have their own token costs as documented in their respective pages.

Esempi di prezzi per casi d’uso di agenti

Comprendere i prezzi per le applicazioni di agenti è cruciale quando si costruisce con Claude. Questi esempi del mondo reale possono aiutarti a stimare i costi per diversi modelli di agenti.

Esempio di agente di supporto clienti

Quando si costruisce un agente di supporto clienti, ecco come potrebbero suddividersi i costi:

Calcolo di esempio per l’elaborazione di 10.000 ticket di supporto:

Media di ~3.700 token per conversazione
Utilizzando Claude Sonnet 4.5 a $3/MTok input,$ 15/MTok output
Costo totale: ~$22.20 per 10.000 ticket

Per una guida dettagliata di questo calcolo, consulta la nostra guida all’agente di supporto clienti.

Prezzi generali del flusso di lavoro degli agenti

Per architetture di agenti più complesse con più passaggi:

Elaborazione della richiesta iniziale
- Input tipico: 500-1.000 token
- Costo di elaborazione: ~$0.003 per richiesta
Recupero di memoria e contesto
- Contesto recuperato: 2.000-5.000 token
- Costo per recupero: ~$0.015 per operazione
Pianificazione ed esecuzione dell’azione
- Token di pianificazione: 1.000-2.000
- Feedback di esecuzione: 500-1.000
- Costo combinato: ~$0.045 per azione

Per una guida completa sui modelli di prezzo degli agenti, consulta la nostra guida ai casi d’uso degli agenti.

Strategie di ottimizzazione dei costi

Quando si costruiscono agenti con Claude:

Usa modelli appropriati: Scegli Haiku per compiti semplici, Sonnet per ragionamento complesso
Implementa il prompt caching: Riduci i costi per contesto ripetuto
Operazioni batch: Usa l’API Batch per compiti non sensibili al tempo
Monitora i modelli di utilizzo: Traccia il consumo di token per identificare opportunità di ottimizzazione

Per applicazioni di agenti ad alto volume, considera di contattare il nostro team vendite enterprise per accordi di prezzo personalizzati.

Considerazioni aggiuntive sui prezzi

Limiti di velocità

I limiti di velocità variano per livello di utilizzo e influenzano quante richieste puoi fare:

Livello 1: Utilizzo di livello base con limiti di base
Livello 2: Limiti aumentati per applicazioni in crescita
Livello 3: Limiti più alti per applicazioni consolidate
Livello 4: Limiti standard massimi
Enterprise: Limiti personalizzati disponibili

Per informazioni dettagliate sui limiti di velocità, consulta la nostra documentazione sui limiti di velocità. Per limiti di velocità più alti o accordi di prezzo personalizzati, contatta il nostro team vendite.

Sconti per volume

Sconti per volume potrebbero essere disponibili per utenti ad alto volume. Questi vengono negoziati caso per caso.

I livelli standard utilizzano i prezzi mostrati sopra
I clienti enterprise possono contattare le vendite per prezzi personalizzati
Sconti accademici e di ricerca potrebbero essere disponibili

Prezzi enterprise

Per clienti enterprise con esigenze specifiche:

Limiti di velocità personalizzati
Sconti per volume
Supporto dedicato
Termini personalizzati

Contatta il nostro team vendite a [email protected] o attraverso la Console Claude per discutere le opzioni di prezzo enterprise.

Fatturazione e pagamento

La fatturazione viene calcolata mensilmente basata sull’utilizzo effettivo
I pagamenti vengono elaborati in USD
Opzioni di carta di credito e fatturazione disponibili
Tracciamento dell’utilizzo disponibile nella Console Claude

Domande frequenti

Come viene calcolato l’utilizzo dei token? I token sono pezzi di testo che i modelli elaborano. Come stima approssimativa, 1 token è circa 4 caratteri o 0,75 parole in inglese. Il conteggio esatto varia per lingua e tipo di contenuto. Ci sono livelli gratuiti o prove? I nuovi utenti ricevono una piccola quantità di crediti gratuiti per testare l’API. Contatta le vendite per informazioni su prove estese per la valutazione enterprise. Come si sommano gli sconti? Gli sconti dell’API Batch e del prompt caching possono essere combinati. Ad esempio, utilizzare entrambe le funzionalità insieme fornisce significativi risparmi sui costi rispetto alle chiamate API standard. Quali metodi di pagamento sono accettati? Accettiamo le principali carte di credito per gli account standard. I clienti enterprise possono organizzare fatturazione e altri metodi di pagamento. Per domande aggiuntive sui prezzi, contatta [email protected].

Primi passi

Modelli e prezzi

Crea con Claude

Capacità

Strumenti

Competenze Agente

Agent SDK

MCP nell'API

Claude su piattaforme di terze parti

Ingegneria dei prompt

Testa e valuta

Rafforza le protezioni

Prezzi dei modelli

Prezzi delle piattaforme di terze parti

Prezzi specifici per funzionalità

Elaborazione batch

Prezzi per contesto lungo

Prezzi per l’uso degli strumenti

Prezzi specifici degli strumenti

Strumento Bash

Strumento di esecuzione codice

Strumento editor di testo

Strumento di ricerca web

Strumento di recupero web

Strumento di uso del computer

Esempi di prezzi per casi d’uso di agenti

Esempio di agente di supporto clienti

Prezzi generali del flusso di lavoro degli agenti

Strategie di ottimizzazione dei costi

Considerazioni aggiuntive sui prezzi

Limiti di velocità

Sconti per volume

Prezzi enterprise

Fatturazione e pagamento

Domande frequenti

Primi passi

Modelli e prezzi

Crea con Claude

Capacità

Strumenti

Competenze Agente

Agent SDK

MCP nell'API

Claude su piattaforme di terze parti

Ingegneria dei prompt

Testa e valuta

Rafforza le protezioni

​Prezzi dei modelli

​Prezzi delle piattaforme di terze parti

​Prezzi specifici per funzionalità

​Elaborazione batch

​Prezzi per contesto lungo

​Prezzi per l’uso degli strumenti

​Prezzi specifici degli strumenti

​Strumento Bash

​Strumento di esecuzione codice

​Strumento editor di testo

​Strumento di ricerca web

​Strumento di recupero web

​Strumento di uso del computer

​Esempi di prezzi per casi d’uso di agenti

​Esempio di agente di supporto clienti

​Prezzi generali del flusso di lavoro degli agenti

​Strategie di ottimizzazione dei costi

​Considerazioni aggiuntive sui prezzi

​Limiti di velocità

​Sconti per volume

​Prezzi enterprise

​Fatturazione e pagamento

​Domande frequenti

Prezzi dei modelli

Prezzi delle piattaforme di terze parti

Prezzi specifici per funzionalità

Elaborazione batch

Prezzi per contesto lungo

Prezzi per l’uso degli strumenti

Prezzi specifici degli strumenti

Strumento Bash

Strumento di esecuzione codice

Strumento editor di testo

Strumento di ricerca web

Strumento di recupero web

Strumento di uso del computer

Esempi di prezzi per casi d’uso di agenti

Esempio di agente di supporto clienti

Prezzi generali del flusso di lavoro degli agenti

Strategie di ottimizzazione dei costi

Considerazioni aggiuntive sui prezzi

Limiti di velocità

Sconti per volume

Prezzi enterprise

Fatturazione e pagamento

Domande frequenti