Diese Seite bietet detaillierte Preisinformationen für Anthropics Modelle und Funktionen. Alle Preise sind in USD angegeben. Für die aktuellsten Preisinformationen besuchen Sie bitte claude.com/pricing.

Modellpreise

Die folgende Tabelle zeigt die Preise für alle Claude-Modelle in verschiedenen Nutzungsstufen:
ModelBase Input Tokens5m Cache Writes1h Cache WritesCache Hits & RefreshesOutput Tokens
Claude Opus 4.1$15 / MTok$18.75 / MTok$30 / MTok$1.50 / MTok$75 / MTok
Claude Opus 4$15 / MTok$18.75 / MTok$30 / MTok$1.50 / MTok$75 / MTok
Claude Sonnet 4.5$3 / MTok$3.75 / MTok$6 / MTok$0.30 / MTok$15 / MTok
Claude Sonnet 4$3 / MTok$3.75 / MTok$6 / MTok$0.30 / MTok$15 / MTok
Claude Sonnet 3.7 (deprecated)$3 / MTok$3.75 / MTok$6 / MTok$0.30 / MTok$15 / MTok
Claude Haiku 4.5$1 / MTok$1.25 / MTok$2 / MTok$0.10 / MTok$5 / MTok
Claude Haiku 3.5$0.80 / MTok$1 / MTok$1.6 / MTok$0.08 / MTok$4 / MTok
Claude Opus 3 (deprecated)$15 / MTok$18.75 / MTok$30 / MTok$1.50 / MTok$75 / MTok
Claude Haiku 3$0.25 / MTok$0.30 / MTok$0.50 / MTok$0.03 / MTok$1.25 / MTok
MTok = Million Token. Die Spalte “Base Input Tokens” zeigt die Standard-Eingabepreise, “Cache Writes” und “Cache Hits” sind spezifisch für Prompt-Caching, und “Output Tokens” zeigt die Ausgabepreise. Prompt-Caching bietet sowohl 5-Minuten- (Standard) als auch 1-Stunden-Cache-Dauern, um die Kosten für verschiedene Anwendungsfälle zu optimieren.Die obige Tabelle spiegelt die folgenden Preismultiplikatoren für Prompt-Caching wider:
  • 5-Minuten-Cache-Schreibtoken kosten das 1,25-fache des Basis-Eingabetoken-Preises
  • 1-Stunden-Cache-Schreibtoken kosten das 2-fache des Basis-Eingabetoken-Preises
  • Cache-Lesetoken kosten das 0,1-fache des Basis-Eingabetoken-Preises

Preise für Drittanbieter-Plattformen

Claude-Modelle sind auf AWS Bedrock und Google Vertex AI verfügbar. Für offizielle Preise besuchen Sie:
Regionale Endpunkt-Preise für Claude 4.5-Modelle und darüber hinausAb Claude Sonnet 4.5 und Haiku 4.5 bieten AWS Bedrock und Google Vertex AI zwei Endpunkt-Typen:
  • Globale Endpunkte: Dynamisches Routing über Regionen für maximale Verfügbarkeit
  • Regionale Endpunkte: Datenrouting garantiert innerhalb spezifischer geografischer Regionen
Regionale Endpunkte beinhalten einen 10%-Aufschlag gegenüber globalen Endpunkten. Die Claude API (1P) ist standardmäßig global und von dieser Änderung nicht betroffen. Die Claude API ist nur global verfügbar (entspricht dem globalen Endpunkt-Angebot und den Preisen anderer Anbieter).Geltungsbereich: Diese Preisstruktur gilt für Claude Sonnet 4.5, Haiku 4.5 und alle zukünftigen Modelle. Frühere Modelle (Claude Sonnet 4, Opus 4 und vorherige Versionen) behalten ihre bestehenden Preise.Für Implementierungsdetails und Codebeispiele:

Funktionsspezifische Preise

Batch-Verarbeitung

Die Batch API ermöglicht die asynchrone Verarbeitung großer Mengen von Anfragen mit einem 50%-Rabatt sowohl auf Eingabe- als auch auf Ausgabetoken.
ModelBatch inputBatch output
Claude Opus 4.1$7.50 / MTok$37.50 / MTok
Claude Opus 4$7.50 / MTok$37.50 / MTok
Claude Sonnet 4.5$1.50 / MTok$7.50 / MTok
Claude Sonnet 4$1.50 / MTok$7.50 / MTok
Claude Sonnet 3.7 (deprecated)$1.50 / MTok$7.50 / MTok
Claude Haiku 4.5$0.50 / MTok$2.50 / MTok
Claude Haiku 3.5$0.40 / MTok$2 / MTok
Claude Opus 3 (deprecated)$7.50 / MTok$37.50 / MTok
Claude Haiku 3$0.125 / MTok$0.625 / MTok
Für weitere Informationen zur Batch-Verarbeitung siehe unsere Batch-Verarbeitungsdokumentation.

Long Context-Preise

Bei der Verwendung von Claude Sonnet 4 oder Sonnet 4.5 mit dem aktivierten 1M-Token-Kontextfenster werden Anfragen, die 200K Eingabetoken überschreiten, automatisch zu Premium-Long-Context-Tarifen berechnet:
Das 1M-Token-Kontextfenster befindet sich derzeit in der Beta-Phase für Organisationen in Nutzungsstufe 4 und Organisationen mit benutzerdefinierten Ratenlimits. Das 1M-Token-Kontextfenster ist nur für Claude Sonnet 4 und Sonnet 4.5 verfügbar.
≤ 200K Eingabetoken> 200K Eingabetoken
Eingabe: $3 / MTokEingabe: $6 / MTok
Ausgabe: $15 / MTokAusgabe: $22.50 / MTok
Long Context-Preise stapeln sich mit anderen Preismodifikatoren:
Auch bei aktiviertem Beta-Flag werden Anfragen mit weniger als 200K Eingabetoken zu Standardtarifen berechnet. Wenn Ihre Anfrage 200K Eingabetoken überschreitet, fallen für alle Token Premium-Preise an.Die 200K-Schwelle basiert ausschließlich auf Eingabetoken (einschließlich Cache-Lese-/Schreibvorgängen). Die Anzahl der Ausgabetoken beeinflusst nicht die Auswahl der Preisstufe, obwohl Ausgabetoken zum höheren Tarif berechnet werden, wenn die Eingabeschwelle überschritten wird.
Um zu überprüfen, ob Ihre API-Anfrage zu 1M-Kontextfenster-Tarifen berechnet wurde, untersuchen Sie das usage-Objekt in der API-Antwort:
{
  "usage": {
    "input_tokens": 250000,
    "cache_creation_input_tokens": 0,
    "cache_read_input_tokens": 0,
    "output_tokens": 500
  }
}
Berechnen Sie die Gesamteingabetoken durch Summierung von:
  • input_tokens
  • cache_creation_input_tokens (bei Verwendung von Prompt-Caching)
  • cache_read_input_tokens (bei Verwendung von Prompt-Caching)
Wenn die Summe 200.000 Token überschreitet, wurde die gesamte Anfrage zu 1M-Kontext-Tarifen abgerechnet. Für weitere Informationen zum usage-Objekt siehe die API-Antwortdokumentation.

Tool-Use-Preise

Tool use requests are priced based on:
  1. The total number of input tokens sent to the model (including in the tools parameter)
  2. The number of output tokens generated
  3. For server-side tools, additional usage-based pricing (e.g., web search charges per search performed)
Client-side tools are priced the same as any other Claude API request, while server-side tools may incur additional charges based on their specific usage. The additional tokens from tool use come from:
  • The tools parameter in API requests (tool names, descriptions, and schemas)
  • tool_use content blocks in API requests and responses
  • tool_result content blocks in API requests
When you use tools, we also automatically include a special system prompt for the model which enables tool use. The number of tool use tokens required for each model are listed below (excluding the additional tokens listed above). Note that the table assumes at least 1 tool is provided. If no tools are provided, then a tool choice of none uses 0 additional system prompt tokens.
ModelTool choiceTool use system prompt token count
Claude Opus 4.1auto, none
any, tool
346 tokens
313 tokens
Claude Opus 4auto, none
any, tool
346 tokens
313 tokens
Claude Sonnet 4.5auto, none
any, tool
346 tokens
313 tokens
Claude Sonnet 4auto, none
any, tool
346 tokens
313 tokens
Claude Sonnet 3.7 (deprecated)auto, none
any, tool
346 tokens
313 tokens
Claude Haiku 4.5auto, none
any, tool
346 tokens
313 tokens
Claude Haiku 3.5auto, none
any, tool
264 tokens
340 tokens
Claude Opus 3 (deprecated)auto, none
any, tool
530 tokens
281 tokens
Claude Sonnet 3auto, none
any, tool
159 tokens
235 tokens
Claude Haiku 3auto, none
any, tool
264 tokens
340 tokens
These token counts are added to your normal input and output tokens to calculate the total cost of a request. Für aktuelle modellspezifische Preise siehe unseren Abschnitt Modellpreise oben. Für weitere Informationen zur Tool-Use-Implementierung und bewährten Praktiken siehe unsere Tool-Use-Dokumentation.

Spezifische Tool-Preise

Bash-Tool

The bash tool adds 245 input tokens to your API calls. Additional tokens are consumed by:
  • Command outputs (stdout/stderr)
  • Error messages
  • Large file contents
Siehe Tool-Use-Preise für vollständige Preisdetails.

Code-Execution-Tool

Code execution tool usage is tracked separately from token usage. Execution time has a minimum of 5 minutes. If files are included in the request, execution time is billed even if the tool is not used due to files being preloaded onto the container. Each organization receives 50 free hours of usage with the code execution tool per day. Additional usage beyond the first 50 hours is billed at $0.05 per hour, per container.

Text-Editor-Tool

The text editor tool uses the same pricing structure as other tools used with Claude. It follows the standard input and output token pricing based on the Claude model you’re using. In addition to the base tokens, the following additional input tokens are needed for the text editor tool:
ToolAdditional input tokens
text_editor_20250429 (Claude 4.x)700 tokens
text_editor_20250124 (Claude Sonnet 3.7 (deprecated))700 tokens
Siehe Tool-Use-Preise für vollständige Preisdetails.

Web-Search-Tool

Web search usage is charged in addition to token usage:
"usage": {
  "input_tokens": 105,
  "output_tokens": 6039,
  "cache_read_input_tokens": 7123,
  "cache_creation_input_tokens": 7345,
  "server_tool_use": {
    "web_search_requests": 1
  }
}
Web search is available on the Claude API for $10 per 1,000 searches, plus standard token costs for search-generated content. Web search results retrieved throughout a conversation are counted as input tokens, in search iterations executed during a single turn and in subsequent conversation turns. Each web search counts as one use, regardless of the number of results returned. If an error occurs during web search, the web search will not be billed.

Web-Fetch-Tool

Web fetch usage has no additional charges beyond standard token costs:
"usage": {
  "input_tokens": 25039,
  "output_tokens": 931,
  "cache_read_input_tokens": 0,
  "cache_creation_input_tokens": 0,
  "server_tool_use": {
    "web_fetch_requests": 1
  }
}
The web fetch tool is available on the Claude API at no additional cost. You only pay standard token costs for the fetched content that becomes part of your conversation context. To protect against inadvertently fetching large content that would consume excessive tokens, use the max_content_tokens parameter to set appropriate limits based on your use case and budget considerations. Example token usage for typical content:
  • Average web page (10KB): ~2,500 tokens
  • Large documentation page (100KB): ~25,000 tokens
  • Research paper PDF (500KB): ~125,000 tokens

Computer-Use-Tool

Computer use follows the standard tool use pricing. When using the computer use tool: System prompt overhead: The computer use beta adds 466-499 tokens to the system prompt Computer use tool token usage:
ModelInput tokens per tool definition
Claude 4.x models735 tokens
Claude Sonnet 3.7 (deprecated)735 tokens
Additional token consumption:
  • Screenshot images (see Vision pricing)
  • Tool execution results returned to Claude
If you’re also using bash or text editor tools alongside computer use, those tools have their own token costs as documented in their respective pages.

Preisbeispiele für Agent-Anwendungsfälle

Das Verständnis der Preise für Agent-Anwendungen ist entscheidend beim Entwickeln mit Claude. Diese realen Beispiele können Ihnen helfen, Kosten für verschiedene Agent-Muster zu schätzen.

Beispiel für Kundensupport-Agent

Beim Erstellen eines Kundensupport-Agenten könnten sich die Kosten folgendermaßen aufschlüsseln:
Beispielberechnung für die Bearbeitung von 10.000 Support-Tickets:
  • Durchschnittlich ~3.700 Token pro Gespräch
  • Verwendung von Claude Sonnet 4.5 zu 3/MTokEingabe,3/MTok Eingabe, 15/MTok Ausgabe
  • Gesamtkosten: ~$22,20 pro 10.000 Tickets
Für eine detaillierte Durchführung dieser Berechnung siehe unseren Kundensupport-Agent-Leitfaden.

Allgemeine Agent-Workflow-Preise

Für komplexere Agent-Architekturen mit mehreren Schritten:
  1. Anfängliche Anfrageverarbeitung
    • Typische Eingabe: 500-1.000 Token
    • Verarbeitungskosten: ~$0,003 pro Anfrage
  2. Speicher- und Kontext-Abruf
    • Abgerufener Kontext: 2.000-5.000 Token
    • Kosten pro Abruf: ~$0,015 pro Vorgang
  3. Aktionsplanung und -ausführung
    • Planungstoken: 1.000-2.000
    • Ausführungsfeedback: 500-1.000
    • Kombinierte Kosten: ~$0,045 pro Aktion
Für einen umfassenden Leitfaden zu Agent-Preismustern siehe unseren Agent-Anwendungsfälle-Leitfaden.

Kostenoptimierungsstrategien

Beim Erstellen von Agenten mit Claude:
  1. Verwenden Sie geeignete Modelle: Wählen Sie Haiku für einfache Aufgaben, Sonnet für komplexe Überlegungen
  2. Implementieren Sie Prompt-Caching: Reduzieren Sie Kosten für wiederholten Kontext
  3. Batch-Operationen: Verwenden Sie die Batch API für nicht zeitkritische Aufgaben
  4. Überwachen Sie Nutzungsmuster: Verfolgen Sie den Token-Verbrauch, um Optimierungsmöglichkeiten zu identifizieren
Für hochvolumige Agent-Anwendungen erwägen Sie, unser Enterprise-Vertriebsteam für individuelle Preisvereinbarungen zu kontaktieren.

Zusätzliche Preisüberlegungen

Ratenlimits

Ratenlimits variieren je nach Nutzungsstufe und beeinflussen, wie viele Anfragen Sie stellen können:
  • Stufe 1: Einstiegsnutzung mit grundlegenden Limits
  • Stufe 2: Erhöhte Limits für wachsende Anwendungen
  • Stufe 3: Höhere Limits für etablierte Anwendungen
  • Stufe 4: Maximale Standardlimits
  • Enterprise: Benutzerdefinierte Limits verfügbar
Für detaillierte Ratenlimit-Informationen siehe unsere Ratenlimits-Dokumentation. Für höhere Ratenlimits oder individuelle Preisvereinbarungen kontaktieren Sie unser Vertriebsteam.

Mengenrabatte

Mengenrabatte können für Nutzer mit hohem Volumen verfügbar sein. Diese werden von Fall zu Fall verhandelt.
  • Standardstufen verwenden die oben gezeigten Preise
  • Enterprise-Kunden können den Vertrieb kontaktieren für individuelle Preise
  • Akademische und Forschungsrabatte können verfügbar sein

Enterprise-Preise

Für Enterprise-Kunden mit spezifischen Bedürfnissen:
  • Benutzerdefinierte Ratenlimits
  • Mengenrabatte
  • Dedizierter Support
  • Individuelle Bedingungen
Kontaktieren Sie unser Vertriebsteam unter [email protected] oder über die Claude Console, um Enterprise-Preisoptionen zu besprechen.

Abrechnung und Zahlung

  • Die Abrechnung erfolgt monatlich basierend auf der tatsächlichen Nutzung
  • Zahlungen werden in USD verarbeitet
  • Kreditkarten- und Rechnungsoptionen verfügbar
  • Nutzungsverfolgung verfügbar in der Claude Console

Häufig gestellte Fragen

Wie wird die Token-Nutzung berechnet? Token sind Textteile, die Modelle verarbeiten. Als grobe Schätzung entspricht 1 Token etwa 4 Zeichen oder 0,75 Wörtern auf Englisch. Die genaue Anzahl variiert je nach Sprache und Inhaltstyp. Gibt es kostenlose Stufen oder Testversionen? Neue Nutzer erhalten eine kleine Menge kostenloser Credits zum Testen der API. Kontaktieren Sie den Vertrieb für Informationen über erweiterte Testversionen für Enterprise-Evaluierungen. Wie stapeln sich Rabatte? Batch API- und Prompt-Caching-Rabatte können kombiniert werden. Zum Beispiel bietet die Verwendung beider Funktionen zusammen erhebliche Kosteneinsparungen im Vergleich zu Standard-API-Aufrufen. Welche Zahlungsmethoden werden akzeptiert? Wir akzeptieren gängige Kreditkarten für Standardkonten. Enterprise-Kunden können Rechnungsstellung und andere Zahlungsmethoden vereinbaren. Für weitere Fragen zu Preisen kontaktieren Sie [email protected].