Modellpreise
Die folgende Tabelle zeigt die Preise für alle Claude-Modelle in verschiedenen Nutzungsstufen:| Model | Base Input Tokens | 5m Cache Writes | 1h Cache Writes | Cache Hits & Refreshes | Output Tokens |
|---|---|---|---|---|---|
| Claude Opus 4.1 | $15 / MTok | $18.75 / MTok | $30 / MTok | $1.50 / MTok | $75 / MTok |
| Claude Opus 4 | $15 / MTok | $18.75 / MTok | $30 / MTok | $1.50 / MTok | $75 / MTok |
| Claude Sonnet 4.5 | $3 / MTok | $3.75 / MTok | $6 / MTok | $0.30 / MTok | $15 / MTok |
| Claude Sonnet 4 | $3 / MTok | $3.75 / MTok | $6 / MTok | $0.30 / MTok | $15 / MTok |
| Claude Sonnet 3.7 (deprecated) | $3 / MTok | $3.75 / MTok | $6 / MTok | $0.30 / MTok | $15 / MTok |
| Claude Haiku 4.5 | $1 / MTok | $1.25 / MTok | $2 / MTok | $0.10 / MTok | $5 / MTok |
| Claude Haiku 3.5 | $0.80 / MTok | $1 / MTok | $1.6 / MTok | $0.08 / MTok | $4 / MTok |
| Claude Opus 3 (deprecated) | $15 / MTok | $18.75 / MTok | $30 / MTok | $1.50 / MTok | $75 / MTok |
| Claude Haiku 3 | $0.25 / MTok | $0.30 / MTok | $0.50 / MTok | $0.03 / MTok | $1.25 / MTok |
MTok = Million Token. Die Spalte “Base Input Tokens” zeigt die Standard-Eingabepreise, “Cache Writes” und “Cache Hits” sind spezifisch für Prompt-Caching, und “Output Tokens” zeigt die Ausgabepreise. Prompt-Caching bietet sowohl 5-Minuten- (Standard) als auch 1-Stunden-Cache-Dauern, um die Kosten für verschiedene Anwendungsfälle zu optimieren.Die obige Tabelle spiegelt die folgenden Preismultiplikatoren für Prompt-Caching wider:
- 5-Minuten-Cache-Schreibtoken kosten das 1,25-fache des Basis-Eingabetoken-Preises
- 1-Stunden-Cache-Schreibtoken kosten das 2-fache des Basis-Eingabetoken-Preises
- Cache-Lesetoken kosten das 0,1-fache des Basis-Eingabetoken-Preises
Preise für Drittanbieter-Plattformen
Claude-Modelle sind auf AWS Bedrock und Google Vertex AI verfügbar. Für offizielle Preise besuchen Sie:Regionale Endpunkt-Preise für Claude 4.5-Modelle und darüber hinausAb Claude Sonnet 4.5 und Haiku 4.5 bieten AWS Bedrock und Google Vertex AI zwei Endpunkt-Typen:
- Globale Endpunkte: Dynamisches Routing über Regionen für maximale Verfügbarkeit
- Regionale Endpunkte: Datenrouting garantiert innerhalb spezifischer geografischer Regionen
Funktionsspezifische Preise
Batch-Verarbeitung
Die Batch API ermöglicht die asynchrone Verarbeitung großer Mengen von Anfragen mit einem 50%-Rabatt sowohl auf Eingabe- als auch auf Ausgabetoken.| Model | Batch input | Batch output |
|---|---|---|
| Claude Opus 4.1 | $7.50 / MTok | $37.50 / MTok |
| Claude Opus 4 | $7.50 / MTok | $37.50 / MTok |
| Claude Sonnet 4.5 | $1.50 / MTok | $7.50 / MTok |
| Claude Sonnet 4 | $1.50 / MTok | $7.50 / MTok |
| Claude Sonnet 3.7 (deprecated) | $1.50 / MTok | $7.50 / MTok |
| Claude Haiku 4.5 | $0.50 / MTok | $2.50 / MTok |
| Claude Haiku 3.5 | $0.40 / MTok | $2 / MTok |
| Claude Opus 3 (deprecated) | $7.50 / MTok | $37.50 / MTok |
| Claude Haiku 3 | $0.125 / MTok | $0.625 / MTok |
Long Context-Preise
Bei der Verwendung von Claude Sonnet 4 oder Sonnet 4.5 mit dem aktivierten 1M-Token-Kontextfenster werden Anfragen, die 200K Eingabetoken überschreiten, automatisch zu Premium-Long-Context-Tarifen berechnet:Das 1M-Token-Kontextfenster befindet sich derzeit in der Beta-Phase für Organisationen in Nutzungsstufe 4 und Organisationen mit benutzerdefinierten Ratenlimits. Das 1M-Token-Kontextfenster ist nur für Claude Sonnet 4 und Sonnet 4.5 verfügbar.
| ≤ 200K Eingabetoken | > 200K Eingabetoken |
|---|---|
| Eingabe: $3 / MTok | Eingabe: $6 / MTok |
| Ausgabe: $15 / MTok | Ausgabe: $22.50 / MTok |
- Der Batch API 50%-Rabatt gilt für Long Context-Preise
- Prompt-Caching-Multiplikatoren gelten zusätzlich zu Long Context-Preisen
Auch bei aktiviertem Beta-Flag werden Anfragen mit weniger als 200K Eingabetoken zu Standardtarifen berechnet. Wenn Ihre Anfrage 200K Eingabetoken überschreitet, fallen für alle Token Premium-Preise an.Die 200K-Schwelle basiert ausschließlich auf Eingabetoken (einschließlich Cache-Lese-/Schreibvorgängen). Die Anzahl der Ausgabetoken beeinflusst nicht die Auswahl der Preisstufe, obwohl Ausgabetoken zum höheren Tarif berechnet werden, wenn die Eingabeschwelle überschritten wird.
usage-Objekt in der API-Antwort:
input_tokenscache_creation_input_tokens(bei Verwendung von Prompt-Caching)cache_read_input_tokens(bei Verwendung von Prompt-Caching)
usage-Objekt siehe die API-Antwortdokumentation.
Tool-Use-Preise
Tool use requests are priced based on:- The total number of input tokens sent to the model (including in the
toolsparameter) - The number of output tokens generated
- For server-side tools, additional usage-based pricing (e.g., web search charges per search performed)
- The
toolsparameter in API requests (tool names, descriptions, and schemas) tool_usecontent blocks in API requests and responsestool_resultcontent blocks in API requests
tools, we also automatically include a special system prompt for the model which enables tool use. The number of tool use tokens required for each model are listed below (excluding the additional tokens listed above). Note that the table assumes at least 1 tool is provided. If no tools are provided, then a tool choice of none uses 0 additional system prompt tokens.
| Model | Tool choice | Tool use system prompt token count |
|---|---|---|
| Claude Opus 4.1 | auto, noneany, tool | 346 tokens 313 tokens |
| Claude Opus 4 | auto, noneany, tool | 346 tokens 313 tokens |
| Claude Sonnet 4.5 | auto, noneany, tool | 346 tokens 313 tokens |
| Claude Sonnet 4 | auto, noneany, tool | 346 tokens 313 tokens |
| Claude Sonnet 3.7 (deprecated) | auto, noneany, tool | 346 tokens 313 tokens |
| Claude Haiku 4.5 | auto, noneany, tool | 346 tokens 313 tokens |
| Claude Haiku 3.5 | auto, noneany, tool | 264 tokens 340 tokens |
| Claude Opus 3 (deprecated) | auto, noneany, tool | 530 tokens 281 tokens |
| Claude Sonnet 3 | auto, noneany, tool | 159 tokens 235 tokens |
| Claude Haiku 3 | auto, noneany, tool | 264 tokens 340 tokens |
Spezifische Tool-Preise
Bash-Tool
The bash tool adds 245 input tokens to your API calls. Additional tokens are consumed by:- Command outputs (stdout/stderr)
- Error messages
- Large file contents
Code-Execution-Tool
Code execution tool usage is tracked separately from token usage. Execution time has a minimum of 5 minutes. If files are included in the request, execution time is billed even if the tool is not used due to files being preloaded onto the container. Each organization receives 50 free hours of usage with the code execution tool per day. Additional usage beyond the first 50 hours is billed at $0.05 per hour, per container.Text-Editor-Tool
The text editor tool uses the same pricing structure as other tools used with Claude. It follows the standard input and output token pricing based on the Claude model you’re using. In addition to the base tokens, the following additional input tokens are needed for the text editor tool:| Tool | Additional input tokens |
|---|---|
text_editor_20250429 (Claude 4.x) | 700 tokens |
text_editor_20250124 (Claude Sonnet 3.7 (deprecated)) | 700 tokens |
Web-Search-Tool
Web search usage is charged in addition to token usage:Web-Fetch-Tool
Web fetch usage has no additional charges beyond standard token costs:max_content_tokens parameter to set appropriate limits based on your use case and budget considerations.
Example token usage for typical content:
- Average web page (10KB): ~2,500 tokens
- Large documentation page (100KB): ~25,000 tokens
- Research paper PDF (500KB): ~125,000 tokens
Computer-Use-Tool
Computer use follows the standard tool use pricing. When using the computer use tool: System prompt overhead: The computer use beta adds 466-499 tokens to the system prompt Computer use tool token usage:| Model | Input tokens per tool definition |
|---|---|
| Claude 4.x models | 735 tokens |
| Claude Sonnet 3.7 (deprecated) | 735 tokens |
- Screenshot images (see Vision pricing)
- Tool execution results returned to Claude
If you’re also using bash or text editor tools alongside computer use, those tools have their own token costs as documented in their respective pages.
Preisbeispiele für Agent-Anwendungsfälle
Das Verständnis der Preise für Agent-Anwendungen ist entscheidend beim Entwickeln mit Claude. Diese realen Beispiele können Ihnen helfen, Kosten für verschiedene Agent-Muster zu schätzen.Beispiel für Kundensupport-Agent
Beim Erstellen eines Kundensupport-Agenten könnten sich die Kosten folgendermaßen aufschlüsseln:Beispielberechnung für die Bearbeitung von 10.000 Support-Tickets:
- Durchschnittlich ~3.700 Token pro Gespräch
- Verwendung von Claude Sonnet 4.5 zu 15/MTok Ausgabe
- Gesamtkosten: ~$22,20 pro 10.000 Tickets
Allgemeine Agent-Workflow-Preise
Für komplexere Agent-Architekturen mit mehreren Schritten:-
Anfängliche Anfrageverarbeitung
- Typische Eingabe: 500-1.000 Token
- Verarbeitungskosten: ~$0,003 pro Anfrage
-
Speicher- und Kontext-Abruf
- Abgerufener Kontext: 2.000-5.000 Token
- Kosten pro Abruf: ~$0,015 pro Vorgang
-
Aktionsplanung und -ausführung
- Planungstoken: 1.000-2.000
- Ausführungsfeedback: 500-1.000
- Kombinierte Kosten: ~$0,045 pro Aktion
Kostenoptimierungsstrategien
Beim Erstellen von Agenten mit Claude:- Verwenden Sie geeignete Modelle: Wählen Sie Haiku für einfache Aufgaben, Sonnet für komplexe Überlegungen
- Implementieren Sie Prompt-Caching: Reduzieren Sie Kosten für wiederholten Kontext
- Batch-Operationen: Verwenden Sie die Batch API für nicht zeitkritische Aufgaben
- Überwachen Sie Nutzungsmuster: Verfolgen Sie den Token-Verbrauch, um Optimierungsmöglichkeiten zu identifizieren
Für hochvolumige Agent-Anwendungen erwägen Sie, unser Enterprise-Vertriebsteam für individuelle Preisvereinbarungen zu kontaktieren.
Zusätzliche Preisüberlegungen
Ratenlimits
Ratenlimits variieren je nach Nutzungsstufe und beeinflussen, wie viele Anfragen Sie stellen können:- Stufe 1: Einstiegsnutzung mit grundlegenden Limits
- Stufe 2: Erhöhte Limits für wachsende Anwendungen
- Stufe 3: Höhere Limits für etablierte Anwendungen
- Stufe 4: Maximale Standardlimits
- Enterprise: Benutzerdefinierte Limits verfügbar
Mengenrabatte
Mengenrabatte können für Nutzer mit hohem Volumen verfügbar sein. Diese werden von Fall zu Fall verhandelt.- Standardstufen verwenden die oben gezeigten Preise
- Enterprise-Kunden können den Vertrieb kontaktieren für individuelle Preise
- Akademische und Forschungsrabatte können verfügbar sein
Enterprise-Preise
Für Enterprise-Kunden mit spezifischen Bedürfnissen:- Benutzerdefinierte Ratenlimits
- Mengenrabatte
- Dedizierter Support
- Individuelle Bedingungen
Abrechnung und Zahlung
- Die Abrechnung erfolgt monatlich basierend auf der tatsächlichen Nutzung
- Zahlungen werden in USD verarbeitet
- Kreditkarten- und Rechnungsoptionen verfügbar
- Nutzungsverfolgung verfügbar in der Claude Console