Preise

Diese Seite bietet detaillierte Preisinformationen für Anthropics Modelle und Funktionen. Alle Preise sind in USD angegeben. Für die aktuellsten Preisinformationen besuchen Sie bitte claude.com/pricing.

Modellpreise

Die folgende Tabelle zeigt die Preise für alle Claude-Modelle in verschiedenen Nutzungsstufen:

Model	Base Input Tokens	5m Cache Writes	1h Cache Writes	Cache Hits & Refreshes	Output Tokens
Claude Opus 4.1	$15 / MTok	$18.75 / MTok	$30 / MTok	$1.50 / MTok	$75 / MTok
Claude Opus 4	$15 / MTok	$18.75 / MTok	$30 / MTok	$1.50 / MTok	$75 / MTok
Claude Sonnet 4.5	$3 / MTok	$3.75 / MTok	$6 / MTok	$0.30 / MTok	$15 / MTok
Claude Sonnet 4	$3 / MTok	$3.75 / MTok	$6 / MTok	$0.30 / MTok	$15 / MTok
Claude Sonnet 3.7 (deprecated)	$3 / MTok	$3.75 / MTok	$6 / MTok	$0.30 / MTok	$15 / MTok
Claude Haiku 4.5	$1 / MTok	$1.25 / MTok	$2 / MTok	$0.10 / MTok	$5 / MTok
Claude Haiku 3.5	$0.80 / MTok	$1 / MTok	$1.6 / MTok	$0.08 / MTok	$4 / MTok
Claude Opus 3 (deprecated)	$15 / MTok	$18.75 / MTok	$30 / MTok	$1.50 / MTok	$75 / MTok
Claude Haiku 3	$0.25 / MTok	$0.30 / MTok	$0.50 / MTok	$0.03 / MTok	$1.25 / MTok

MTok = Million Token. Die Spalte “Base Input Tokens” zeigt die Standard-Eingabepreise, “Cache Writes” und “Cache Hits” sind spezifisch für Prompt-Caching, und “Output Tokens” zeigt die Ausgabepreise. Prompt-Caching bietet sowohl 5-Minuten- (Standard) als auch 1-Stunden-Cache-Dauern, um die Kosten für verschiedene Anwendungsfälle zu optimieren.Die obige Tabelle spiegelt die folgenden Preismultiplikatoren für Prompt-Caching wider:

5-Minuten-Cache-Schreibtoken kosten das 1,25-fache des Basis-Eingabetoken-Preises
1-Stunden-Cache-Schreibtoken kosten das 2-fache des Basis-Eingabetoken-Preises
Cache-Lesetoken kosten das 0,1-fache des Basis-Eingabetoken-Preises

Preise für Drittanbieter-Plattformen

Claude-Modelle sind auf AWS Bedrock und Google Vertex AI verfügbar. Für offizielle Preise besuchen Sie:

Regionale Endpunkt-Preise für Claude 4.5-Modelle und darüber hinausAb Claude Sonnet 4.5 und Haiku 4.5 bieten AWS Bedrock und Google Vertex AI zwei Endpunkt-Typen:

Globale Endpunkte: Dynamisches Routing über Regionen für maximale Verfügbarkeit
Regionale Endpunkte: Datenrouting garantiert innerhalb spezifischer geografischer Regionen

Regionale Endpunkte beinhalten einen 10%-Aufschlag gegenüber globalen Endpunkten. Die Claude API (1P) ist standardmäßig global und von dieser Änderung nicht betroffen. Die Claude API ist nur global verfügbar (entspricht dem globalen Endpunkt-Angebot und den Preisen anderer Anbieter).Geltungsbereich: Diese Preisstruktur gilt für Claude Sonnet 4.5, Haiku 4.5 und alle zukünftigen Modelle. Frühere Modelle (Claude Sonnet 4, Opus 4 und vorherige Versionen) behalten ihre bestehenden Preise.Für Implementierungsdetails und Codebeispiele:

Funktionsspezifische Preise

Batch-Verarbeitung

Die Batch API ermöglicht die asynchrone Verarbeitung großer Mengen von Anfragen mit einem 50%-Rabatt sowohl auf Eingabe- als auch auf Ausgabetoken.

Model	Batch input	Batch output
Claude Opus 4.1	$7.50 / MTok	$37.50 / MTok
Claude Opus 4	$7.50 / MTok	$37.50 / MTok
Claude Sonnet 4.5	$1.50 / MTok	$7.50 / MTok
Claude Sonnet 4	$1.50 / MTok	$7.50 / MTok
Claude Sonnet 3.7 (deprecated)	$1.50 / MTok	$7.50 / MTok
Claude Haiku 4.5	$0.50 / MTok	$2.50 / MTok
Claude Haiku 3.5	$0.40 / MTok	$2 / MTok
Claude Opus 3 (deprecated)	$7.50 / MTok	$37.50 / MTok
Claude Haiku 3	$0.125 / MTok	$0.625 / MTok

Für weitere Informationen zur Batch-Verarbeitung siehe unsere Batch-Verarbeitungsdokumentation.

Long Context-Preise

Bei der Verwendung von Claude Sonnet 4 oder Sonnet 4.5 mit dem aktivierten 1M-Token-Kontextfenster werden Anfragen, die 200K Eingabetoken überschreiten, automatisch zu Premium-Long-Context-Tarifen berechnet:

Das 1M-Token-Kontextfenster befindet sich derzeit in der Beta-Phase für Organisationen in Nutzungsstufe 4 und Organisationen mit benutzerdefinierten Ratenlimits. Das 1M-Token-Kontextfenster ist nur für Claude Sonnet 4 und Sonnet 4.5 verfügbar.

≤ 200K Eingabetoken	> 200K Eingabetoken
Eingabe: $3 / MTok	Eingabe: $6 / MTok
Ausgabe: $15 / MTok	Ausgabe: $22.50 / MTok

Long Context-Preise stapeln sich mit anderen Preismodifikatoren:

Der Batch API 50%-Rabatt gilt für Long Context-Preise
Prompt-Caching-Multiplikatoren gelten zusätzlich zu Long Context-Preisen

Auch bei aktiviertem Beta-Flag werden Anfragen mit weniger als 200K Eingabetoken zu Standardtarifen berechnet. Wenn Ihre Anfrage 200K Eingabetoken überschreitet, fallen für alle Token Premium-Preise an.Die 200K-Schwelle basiert ausschließlich auf Eingabetoken (einschließlich Cache-Lese-/Schreibvorgängen). Die Anzahl der Ausgabetoken beeinflusst nicht die Auswahl der Preisstufe, obwohl Ausgabetoken zum höheren Tarif berechnet werden, wenn die Eingabeschwelle überschritten wird.

Um zu überprüfen, ob Ihre API-Anfrage zu 1M-Kontextfenster-Tarifen berechnet wurde, untersuchen Sie das usage-Objekt in der API-Antwort:

{
  "usage": {
    "input_tokens": 250000,
    "cache_creation_input_tokens": 0,
    "cache_read_input_tokens": 0,
    "output_tokens": 500
  }
}

Berechnen Sie die Gesamteingabetoken durch Summierung von:

input_tokens
cache_creation_input_tokens (bei Verwendung von Prompt-Caching)
cache_read_input_tokens (bei Verwendung von Prompt-Caching)

Wenn die Summe 200.000 Token überschreitet, wurde die gesamte Anfrage zu 1M-Kontext-Tarifen abgerechnet. Für weitere Informationen zum usage-Objekt siehe die API-Antwortdokumentation.

Tool-Use-Preise

Tool use requests are priced based on:

The total number of input tokens sent to the model (including in the tools parameter)
The number of output tokens generated
For server-side tools, additional usage-based pricing (e.g., web search charges per search performed)

Client-side tools are priced the same as any other Claude API request, while server-side tools may incur additional charges based on their specific usage. The additional tokens from tool use come from:

The tools parameter in API requests (tool names, descriptions, and schemas)
tool_use content blocks in API requests and responses
tool_result content blocks in API requests

When you use tools, we also automatically include a special system prompt for the model which enables tool use. The number of tool use tokens required for each model are listed below (excluding the additional tokens listed above). Note that the table assumes at least 1 tool is provided. If no tools are provided, then a tool choice of none uses 0 additional system prompt tokens.

Model	Tool choice	Tool use system prompt token count
Claude Opus 4.1	`auto`, `none` `any`, `tool`	346 tokens 313 tokens
Claude Opus 4	`auto`, `none` `any`, `tool`	346 tokens 313 tokens
Claude Sonnet 4.5	`auto`, `none` `any`, `tool`	346 tokens 313 tokens
Claude Sonnet 4	`auto`, `none` `any`, `tool`	346 tokens 313 tokens
Claude Sonnet 3.7 (deprecated)	`auto`, `none` `any`, `tool`	346 tokens 313 tokens
Claude Haiku 4.5	`auto`, `none` `any`, `tool`	346 tokens 313 tokens
Claude Haiku 3.5	`auto`, `none` `any`, `tool`	264 tokens 340 tokens
Claude Opus 3 (deprecated)	`auto`, `none` `any`, `tool`	530 tokens 281 tokens
Claude Sonnet 3	`auto`, `none` `any`, `tool`	159 tokens 235 tokens
Claude Haiku 3	`auto`, `none` `any`, `tool`	264 tokens 340 tokens

These token counts are added to your normal input and output tokens to calculate the total cost of a request. Für aktuelle modellspezifische Preise siehe unseren Abschnitt Modellpreise oben. Für weitere Informationen zur Tool-Use-Implementierung und bewährten Praktiken siehe unsere Tool-Use-Dokumentation.

Spezifische Tool-Preise

Bash-Tool

The bash tool adds 245 input tokens to your API calls. Additional tokens are consumed by:

Command outputs (stdout/stderr)
Error messages
Large file contents

Siehe Tool-Use-Preise für vollständige Preisdetails.

Code-Execution-Tool

Code execution tool usage is tracked separately from token usage. Execution time has a minimum of 5 minutes. If files are included in the request, execution time is billed even if the tool is not used due to files being preloaded onto the container. Each organization receives 50 free hours of usage with the code execution tool per day. Additional usage beyond the first 50 hours is billed at $0.05 per hour, per container.

Text-Editor-Tool

The text editor tool uses the same pricing structure as other tools used with Claude. It follows the standard input and output token pricing based on the Claude model you’re using. In addition to the base tokens, the following additional input tokens are needed for the text editor tool:

Tool	Additional input tokens
`text_editor_20250429` (Claude 4.x)	700 tokens
`text_editor_20250124` (Claude Sonnet 3.7 (deprecated))	700 tokens

Siehe Tool-Use-Preise für vollständige Preisdetails.

Web-Search-Tool

Web search usage is charged in addition to token usage:

"usage": {
  "input_tokens": 105,
  "output_tokens": 6039,
  "cache_read_input_tokens": 7123,
  "cache_creation_input_tokens": 7345,
  "server_tool_use": {
    "web_search_requests": 1
  }
}

Web search is available on the Claude API for $10 per 1,000 searches, plus standard token costs for search-generated content. Web search results retrieved throughout a conversation are counted as input tokens, in search iterations executed during a single turn and in subsequent conversation turns. Each web search counts as one use, regardless of the number of results returned. If an error occurs during web search, the web search will not be billed.

Web-Fetch-Tool

Web fetch usage has no additional charges beyond standard token costs:

"usage": {
  "input_tokens": 25039,
  "output_tokens": 931,
  "cache_read_input_tokens": 0,
  "cache_creation_input_tokens": 0,
  "server_tool_use": {
    "web_fetch_requests": 1
  }
}

The web fetch tool is available on the Claude API at no additional cost. You only pay standard token costs for the fetched content that becomes part of your conversation context. To protect against inadvertently fetching large content that would consume excessive tokens, use the max_content_tokens parameter to set appropriate limits based on your use case and budget considerations. Example token usage for typical content:

Average web page (10KB): ~2,500 tokens
Large documentation page (100KB): ~25,000 tokens
Research paper PDF (500KB): ~125,000 tokens

Computer-Use-Tool

Computer use follows the standard tool use pricing. When using the computer use tool: System prompt overhead: The computer use beta adds 466-499 tokens to the system prompt Computer use tool token usage:

Model	Input tokens per tool definition
Claude 4.x models	735 tokens
Claude Sonnet 3.7 (deprecated)	735 tokens

Additional token consumption:

Screenshot images (see Vision pricing)
Tool execution results returned to Claude

If you’re also using bash or text editor tools alongside computer use, those tools have their own token costs as documented in their respective pages.

Preisbeispiele für Agent-Anwendungsfälle

Das Verständnis der Preise für Agent-Anwendungen ist entscheidend beim Entwickeln mit Claude. Diese realen Beispiele können Ihnen helfen, Kosten für verschiedene Agent-Muster zu schätzen.

Beispiel für Kundensupport-Agent

Beim Erstellen eines Kundensupport-Agenten könnten sich die Kosten folgendermaßen aufschlüsseln:

Beispielberechnung für die Bearbeitung von 10.000 Support-Tickets:

Durchschnittlich ~3.700 Token pro Gespräch
Verwendung von Claude Sonnet 4.5 zu $3/MTok Eingabe,$ 15/MTok Ausgabe
Gesamtkosten: ~$22,20 pro 10.000 Tickets

Für eine detaillierte Durchführung dieser Berechnung siehe unseren Kundensupport-Agent-Leitfaden.

Allgemeine Agent-Workflow-Preise

Für komplexere Agent-Architekturen mit mehreren Schritten:

Anfängliche Anfrageverarbeitung
- Typische Eingabe: 500-1.000 Token
- Verarbeitungskosten: ~$0,003 pro Anfrage
Speicher- und Kontext-Abruf
- Abgerufener Kontext: 2.000-5.000 Token
- Kosten pro Abruf: ~$0,015 pro Vorgang
Aktionsplanung und -ausführung
- Planungstoken: 1.000-2.000
- Ausführungsfeedback: 500-1.000
- Kombinierte Kosten: ~$0,045 pro Aktion

Für einen umfassenden Leitfaden zu Agent-Preismustern siehe unseren Agent-Anwendungsfälle-Leitfaden.

Kostenoptimierungsstrategien

Beim Erstellen von Agenten mit Claude:

Verwenden Sie geeignete Modelle: Wählen Sie Haiku für einfache Aufgaben, Sonnet für komplexe Überlegungen
Implementieren Sie Prompt-Caching: Reduzieren Sie Kosten für wiederholten Kontext
Batch-Operationen: Verwenden Sie die Batch API für nicht zeitkritische Aufgaben
Überwachen Sie Nutzungsmuster: Verfolgen Sie den Token-Verbrauch, um Optimierungsmöglichkeiten zu identifizieren

Für hochvolumige Agent-Anwendungen erwägen Sie, unser Enterprise-Vertriebsteam für individuelle Preisvereinbarungen zu kontaktieren.

Zusätzliche Preisüberlegungen

Ratenlimits

Ratenlimits variieren je nach Nutzungsstufe und beeinflussen, wie viele Anfragen Sie stellen können:

Stufe 1: Einstiegsnutzung mit grundlegenden Limits
Stufe 2: Erhöhte Limits für wachsende Anwendungen
Stufe 3: Höhere Limits für etablierte Anwendungen
Stufe 4: Maximale Standardlimits
Enterprise: Benutzerdefinierte Limits verfügbar

Für detaillierte Ratenlimit-Informationen siehe unsere Ratenlimits-Dokumentation. Für höhere Ratenlimits oder individuelle Preisvereinbarungen kontaktieren Sie unser Vertriebsteam.

Mengenrabatte

Mengenrabatte können für Nutzer mit hohem Volumen verfügbar sein. Diese werden von Fall zu Fall verhandelt.

Standardstufen verwenden die oben gezeigten Preise
Enterprise-Kunden können den Vertrieb kontaktieren für individuelle Preise
Akademische und Forschungsrabatte können verfügbar sein

Enterprise-Preise

Für Enterprise-Kunden mit spezifischen Bedürfnissen:

Benutzerdefinierte Ratenlimits
Mengenrabatte
Dedizierter Support
Individuelle Bedingungen

Kontaktieren Sie unser Vertriebsteam unter [email protected] oder über die Claude Console, um Enterprise-Preisoptionen zu besprechen.

Abrechnung und Zahlung

Die Abrechnung erfolgt monatlich basierend auf der tatsächlichen Nutzung
Zahlungen werden in USD verarbeitet
Kreditkarten- und Rechnungsoptionen verfügbar
Nutzungsverfolgung verfügbar in der Claude Console

Häufig gestellte Fragen

Wie wird die Token-Nutzung berechnet? Token sind Textteile, die Modelle verarbeiten. Als grobe Schätzung entspricht 1 Token etwa 4 Zeichen oder 0,75 Wörtern auf Englisch. Die genaue Anzahl variiert je nach Sprache und Inhaltstyp. Gibt es kostenlose Stufen oder Testversionen? Neue Nutzer erhalten eine kleine Menge kostenloser Credits zum Testen der API. Kontaktieren Sie den Vertrieb für Informationen über erweiterte Testversionen für Enterprise-Evaluierungen. Wie stapeln sich Rabatte? Batch API- und Prompt-Caching-Rabatte können kombiniert werden. Zum Beispiel bietet die Verwendung beider Funktionen zusammen erhebliche Kosteneinsparungen im Vergleich zu Standard-API-Aufrufen. Welche Zahlungsmethoden werden akzeptiert? Wir akzeptieren gängige Kreditkarten für Standardkonten. Enterprise-Kunden können Rechnungsstellung und andere Zahlungsmethoden vereinbaren. Für weitere Fragen zu Preisen kontaktieren Sie [email protected].

Erste Schritte

Modelle & Preise

Mit Claude entwickeln

Funktionen

Werkzeuge

Agent-Fähigkeiten

Agent SDK

MCP in der API

Claude auf Drittanbieter-Plattformen

Prompt-Engineering

Testen & bewerten

Schutzmaßnahmen verstärken

Modellpreise

Preise für Drittanbieter-Plattformen

Funktionsspezifische Preise

Batch-Verarbeitung

Long Context-Preise

Tool-Use-Preise

Spezifische Tool-Preise

Bash-Tool

Code-Execution-Tool

Text-Editor-Tool

Web-Search-Tool

Web-Fetch-Tool

Computer-Use-Tool

Preisbeispiele für Agent-Anwendungsfälle

Beispiel für Kundensupport-Agent

Allgemeine Agent-Workflow-Preise

Kostenoptimierungsstrategien

Zusätzliche Preisüberlegungen

Ratenlimits

Mengenrabatte

Enterprise-Preise

Abrechnung und Zahlung

Häufig gestellte Fragen

Erste Schritte

Modelle & Preise

Mit Claude entwickeln

Funktionen

Werkzeuge

Agent-Fähigkeiten

Agent SDK

MCP in der API

Claude auf Drittanbieter-Plattformen

Prompt-Engineering

Testen & bewerten

Schutzmaßnahmen verstärken

​Modellpreise

​Preise für Drittanbieter-Plattformen

​Funktionsspezifische Preise

​Batch-Verarbeitung

​Long Context-Preise

​Tool-Use-Preise

​Spezifische Tool-Preise

​Bash-Tool

​Code-Execution-Tool

​Text-Editor-Tool

​Web-Search-Tool

​Web-Fetch-Tool

​Computer-Use-Tool

​Preisbeispiele für Agent-Anwendungsfälle

​Beispiel für Kundensupport-Agent

​Allgemeine Agent-Workflow-Preise

​Kostenoptimierungsstrategien

​Zusätzliche Preisüberlegungen

​Ratenlimits

​Mengenrabatte

​Enterprise-Preise

​Abrechnung und Zahlung

​Häufig gestellte Fragen

Modellpreise

Preise für Drittanbieter-Plattformen

Funktionsspezifische Preise

Batch-Verarbeitung

Long Context-Preise

Tool-Use-Preise

Spezifische Tool-Preise

Bash-Tool

Code-Execution-Tool

Text-Editor-Tool

Web-Search-Tool

Web-Fetch-Tool

Computer-Use-Tool

Preisbeispiele für Agent-Anwendungsfälle

Beispiel für Kundensupport-Agent

Allgemeine Agent-Workflow-Preise

Kostenoptimierungsstrategien

Zusätzliche Preisüberlegungen

Ratenlimits

Mengenrabatte

Enterprise-Preise

Abrechnung und Zahlung

Häufig gestellte Fragen