Claude 4.5 führt zwei Modelle ein, die für verschiedene Anwendungsfälle entwickelt wurden:
  • Claude Sonnet 4.5: Unser bestes Modell für komplexe Agenten und Programmierung, mit der höchsten Intelligenz bei den meisten Aufgaben
  • Claude Haiku 4.5: Unser schnellstes und intelligentestes Haiku-Modell mit nahezu grenzenloser Leistung. Das erste Haiku-Modell mit erweitertem Denken

Wichtige Verbesserungen in Sonnet 4.5 gegenüber Sonnet 4

Programmierexzellenz

Claude Sonnet 4.5 ist unser bestes Programmiermodell bis heute, mit erheblichen Verbesserungen im gesamten Entwicklungslebenszyklus:
  • SWE-bench Verified Leistung: Fortgeschrittener Stand der Technik bei Programmierbenchmarks
  • Verbesserte Planung und Systemdesign: Bessere architektonische Entscheidungen und Code-Organisation
  • Verbesserte Sicherheitstechnik: Robustere Sicherheitspraktiken und Schwachstellenerkennung
  • Bessere Anweisungsbefolgung: Präzisere Einhaltung von Programmierungsspezifikationen und -anforderungen
Claude Sonnet 4.5 funktioniert deutlich besser bei Programmieraufgaben, wenn erweitertes Denken aktiviert ist. Erweitertes Denken ist standardmäßig deaktiviert, aber wir empfehlen, es für komplexe Programmierarbeiten zu aktivieren. Beachten Sie, dass erweitertes Denken die Prompt-Caching-Effizienz beeinflusst. Siehe den Migrationsleitfaden für Konfigurationsdetails.

Agent-Fähigkeiten

Claude Sonnet 4.5 führt große Fortschritte bei Agent-Fähigkeiten ein:
  • Erweiterte autonome Bedienung: Sonnet 4.5 kann stundenlang unabhängig arbeiten, während es Klarheit und Fokus auf schrittweise Fortschritte beibehält. Das Modell macht stetige Fortschritte bei einigen wenigen Aufgaben gleichzeitig, anstatt alles auf einmal zu versuchen. Es liefert faktenbasierte Fortschrittsupdates, die genau widerspiegeln, was erreicht wurde.
  • Kontextbewusstsein: Claude verfolgt jetzt seine Token-Nutzung während Gesprächen und erhält Updates nach jedem Tool-Aufruf. Dieses Bewusstsein hilft, vorzeitiges Aufgeben von Aufgaben zu verhindern und ermöglicht eine effektivere Ausführung bei langwierigen Aufgaben. Siehe Kontextbewusstsein für technische Details und Prompting-Anleitung.
  • Verbesserte Tool-Nutzung: Das Modell nutzt parallele Tool-Aufrufe effektiver und führt mehrere spekulative Suchen gleichzeitig während der Recherche durch und liest mehrere Dateien gleichzeitig, um schneller Kontext aufzubauen. Verbesserte Koordination zwischen mehreren Tools und Informationsquellen ermöglicht es dem Modell, eine breite Palette von Fähigkeiten in agentischen Such- und Programmier-Workflows effektiv zu nutzen.
  • Erweiterte Kontextverwaltung: Sonnet 4.5 behält außergewöhnliche Zustandsverfolgung in externen Dateien bei und bewahrt Zielorientierung über Sitzungen hinweg. In Kombination mit effektiverer Kontextfenster-Nutzung und unseren neuen Kontextverwaltungs-API-Funktionen handhabt das Modell Informationen über erweiterte Sitzungen optimal, um Kohärenz über die Zeit zu erhalten.
Kontextbewusstsein ist verfügbar in Claude Sonnet 4, Sonnet 4.5, Haiku 4.5, Opus 4 und Opus 4.1.

Kommunikations- und Interaktionsstil

Claude Sonnet 4.5 hat einen verfeinerten Kommunikationsansatz, der prägnant, direkt und natürlich ist. Es liefert faktenbasierte Fortschrittsupdates und kann ausführliche Zusammenfassungen nach Tool-Aufrufen überspringen, um den Workflow-Schwung aufrechtzuerhalten (obwohl dies mit Prompting angepasst werden kann). Für detaillierte Anleitung zur Arbeit mit diesem Kommunikationsstil siehe Claude 4 Best Practices.

Kreative Inhaltserstellung

Claude Sonnet 4.5 zeichnet sich bei kreativen Inhaltsaufgaben aus:
  • Präsentationen und Animationen: Erreicht oder übertrifft Claude Opus 4.1 bei der Erstellung von Folien und visuellen Inhalten
  • Kreatives Flair: Produziert polierte, professionelle Ausgaben mit starker Anweisungsbefolgung
  • Qualität beim ersten Versuch: Generiert verwendbare, gut gestaltete Inhalte bei ersten Versuchen

Wichtige Verbesserungen in Haiku 4.5 gegenüber Haiku 3.5

Claude Haiku 4.5 stellt einen transformativen Sprung für die Haiku-Modellfamilie dar und bringt Grenzfähigkeiten zu unserer schnellsten Modellklasse:

Nahezu grenzenlose Intelligenz mit blitzschneller Geschwindigkeit

Claude Haiku 4.5 liefert nahezu grenzenlose Leistung, die Sonnet 4 bei deutlich niedrigeren Kosten und schnellerer Geschwindigkeit entspricht:
  • Nahezu grenzenlose Intelligenz: Entspricht der Sonnet 4-Leistung bei Argumentation, Programmierung und komplexen Aufgaben
  • Verbesserte Geschwindigkeit: Mehr als doppelt so schnell wie Sonnet 4, mit Optimierungen für Ausgabe-Token pro Sekunde (OTPS)
  • Optimales Kosten-Leistungs-Verhältnis: Nahezu grenzenlose Intelligenz zu einem Drittel der Kosten, ideal für Hochvolumen-Deployments

Erweiterte Denkfähigkeiten

Claude Haiku 4.5 ist das erste Haiku-Modell, das erweitertes Denken unterstützt und erweiterte Argumentationsfähigkeiten zur Haiku-Familie bringt:
  • Argumentation mit Geschwindigkeit: Zugang zu Claudes internem Argumentationsprozess für komplexe Problemlösung
  • Denk-Zusammenfassung: Zusammengefasste Denkausgabe für produktionsreife Deployments
  • Verschachteltes Denken: Denken zwischen Tool-Aufrufen für anspruchsvollere mehrstufige Workflows
  • Budget-Kontrolle: Konfigurieren Sie Denk-Token-Budgets, um Argumentationstiefe mit Geschwindigkeit auszubalancieren
Erweitertes Denken muss explizit aktiviert werden, indem ein thinking-Parameter zu Ihren API-Anfragen hinzugefügt wird. Siehe die Erweiterte Denk-Dokumentation für Implementierungsdetails.
Claude Haiku 4.5 funktioniert deutlich besser bei Programmier- und Argumentationsaufgaben, wenn erweitertes Denken aktiviert ist. Erweitertes Denken ist standardmäßig deaktiviert, aber wir empfehlen, es für komplexe Problemlösung, Programmierarbeiten und mehrstufige Argumentation zu aktivieren. Beachten Sie, dass erweitertes Denken die Prompt-Caching-Effizienz beeinflusst. Siehe den Migrationsleitfaden für Konfigurationsdetails.
Verfügbar in Claude Sonnet 3.7, Sonnet 4, Sonnet 4.5, Haiku 4.5, Opus 4 und Opus 4.1.

Kontextbewusstsein

Claude Haiku 4.5 verfügt über Kontextbewusstsein, das es dem Modell ermöglicht, sein verbleibendes Kontextfenster während eines Gesprächs zu verfolgen:
  • Token-Budget-Verfolgung: Claude erhält Echtzeit-Updates über die verbleibende Kontextkapazität nach jedem Tool-Aufruf
  • Bessere Aufgabenpersistenz: Das Modell kann Aufgaben effektiver ausführen, indem es den verfügbaren Arbeitsbereich versteht
  • Multi-Kontextfenster-Workflows: Verbesserte Handhabung von Zustandsübergängen über erweiterte Sitzungen
Dies ist das erste Haiku-Modell mit nativen Kontextbewusstseinsfähigkeiten. Für Prompting-Anleitung siehe Claude 4 Best Practices.
Verfügbar in Claude Sonnet 4, Sonnet 4.5, Haiku 4.5, Opus 4 und Opus 4.1.

Starke Programmierung und Tool-Nutzung

Claude Haiku 4.5 liefert robuste Programmierfähigkeiten, die von modernen Claude-Modellen erwartet werden:
  • Programmier-Kompetenz: Starke Leistung bei Code-Generierung, Debugging und Refactoring-Aufgaben
  • Vollständige Tool-Unterstützung: Kompatibel mit allen Claude 4-Tools einschließlich Bash, Code-Ausführung, Texteditor, Websuche und Computer-Nutzung
  • Verbesserte Computer-Nutzung: Optimiert für autonome Desktop-Interaktion und Browser-Automatisierungs-Workflows
  • Parallele Tool-Ausführung: Effiziente Koordination zwischen mehreren Tools für komplexe Workflows
Haiku 4.5 ist für Anwendungsfälle konzipiert, die sowohl Intelligenz als auch Effizienz erfordern:
  • Echtzeit-Anwendungen: Schnelle Antwortzeiten für interaktive Benutzererfahrungen
  • Hochvolumen-Verarbeitung: Kosteneffektive Intelligenz für groß angelegte Deployments
  • Free-Tier-Implementierungen: Premium-Modellqualität zu erschwinglichen Preisen
  • Sub-Agent-Architekturen: Schnelle, intelligente Agenten für Multi-Agent-Systeme
  • Computer-Nutzung im großen Maßstab: Kosteneffektive autonome Desktop- und Browser-Automatisierung

Neue API-Funktionen

Memory-Tool (Beta)

Das neue Memory-Tool ermöglicht es Claude, Informationen außerhalb des Kontextfensters zu speichern und abzurufen:
tools=[
    {
        "type": "memory_20250818",
        "name": "memory"
    }
]
Dies ermöglicht:
  • Aufbau von Wissensbasen über die Zeit
  • Aufrechterhaltung des Projektzustands über Sitzungen hinweg
  • Bewahrung praktisch unbegrenzten Kontexts durch dateibasierte Speicherung
Verfügbar in Claude Sonnet 4, Sonnet 4.5, Haiku 4.5, Opus 4 und Opus 4.1. Erfordert Beta-Header: context-management-2025-06-27

Kontextbearbeitung

Verwenden Sie Kontextbearbeitung für intelligente Kontextverwaltung durch automatisches Löschen von Tool-Aufrufen:
response = client.beta.messages.create(
    betas=["context-management-2025-06-27"],
    model="claude-sonnet-4-5",  # oder claude-haiku-4-5
    max_tokens=4096,
    messages=[{"role": "user", "content": "..."}],
    context_management={
        "edits": [
            {
                "type": "clear_tool_uses_20250919",
                "trigger": {"type": "input_tokens", "value": 500},
                "keep": {"type": "tool_uses", "value": 2},
                "clear_at_least": {"type": "input_tokens", "value": 100}
            }
        ]
    },
    tools=[...]
)
Diese Funktion entfernt automatisch ältere Tool-Aufrufe und -Ergebnisse, wenn Token-Limits erreicht werden, und hilft bei der Kontextverwaltung in langwierigen Agent-Sitzungen.
Verfügbar in Claude Sonnet 4, Sonnet 4.5, Haiku 4.5, Opus 4 und Opus 4.1. Erfordert Beta-Header: context-management-2025-06-27

Verbesserte Stopp-Gründe

Claude 4.5-Modelle führen einen neuen model_context_window_exceeded-Stopp-Grund ein, der explizit anzeigt, wann die Generierung aufgrund des Erreichens des Kontextfenster-Limits gestoppt wurde, anstatt des angeforderten max_tokens-Limits. Dies macht es einfacher, Kontextfenster-Limits in Ihrer Anwendungslogik zu handhaben.
{
  "stop_reason": "model_context_window_exceeded",
  "usage": {
    "input_tokens": 150000,
    "output_tokens": 49950
  }
}

Verbesserte Tool-Parameter-Handhabung

Claude 4.5-Modelle enthalten eine Fehlerbehebung, die absichtliche Formatierung in Tool-Aufruf-String-Parametern bewahrt. Zuvor wurden nachgestellte Zeilenumbrüche in String-Parametern manchmal fälschlicherweise entfernt. Diese Korrektur stellt sicher, dass Tools, die präzise Formatierung erfordern (wie Texteditoren), Parameter genau wie beabsichtigt erhalten.
Dies ist eine Verbesserung im Hintergrund ohne erforderliche API-Änderungen. Tools mit String-Parametern können jedoch jetzt Werte mit nachgestellten Zeilenumbrüchen erhalten, die zuvor entfernt wurden.
Beispiel:
// Vorher: Abschließender Zeilenumbruch versehentlich entfernt
{
  "type": "tool_use",
  "id": "toolu_01A09q90qw90lq917835lq9",
  "name": "edit_todo",
  "input": {
    "file": "todo.txt",
    "contents": "1. Chop onions.\n2. ???\n3. Profit"
  }
}

// Nachher: Nachgestellter Zeilenumbruch wie beabsichtigt bewahrt
{
  "type": "tool_use",
  "id": "toolu_01A09q90qw90lq917835lq9",
  "name": "edit_todo",
  "input": {
    "file": "todo.txt",
    "contents": "1. Chop onions.\n2. ???\n3. Profit\n"
  }
}

Token-Anzahl-Optimierungen

Claude 4.5-Modelle enthalten automatische Optimierungen zur Verbesserung der Modellleistung. Diese Optimierungen können kleine Mengen von Token zu Anfragen hinzufügen, aber Sie werden nicht für diese systemseitig hinzugefügten Token berechnet.

In Claude 4 eingeführte Funktionen

Die folgenden Funktionen wurden in Claude 4 eingeführt und sind in allen Claude 4-Modellen verfügbar, einschließlich Claude Sonnet 4.5 und Claude Haiku 4.5.

Neuer Ablehnungs-Stopp-Grund

Claude 4-Modelle führen einen neuen refusal-Stopp-Grund für Inhalte ein, die das Modell aus Sicherheitsgründen nicht zu generieren bereit ist:
{"id":"msg_014XEDjypDjFzgKVWdFUXxZP",
"type":"message",
"role":"assistant",
"model":"claude-sonnet-4-5",
"content":[{"type":"text","text":"I would be happy to assist you. You can "}],
"stop_reason":"refusal",
"stop_sequence":null,
"usage":{"input_tokens":564,"cache_creation_input_tokens":0,"cache_read_input_tokens":0,"output_tokens":22}
}
Bei der Verwendung von Claude 4-Modellen sollten Sie Ihre Anwendung aktualisieren, um refusal-Stopp-Gründe zu handhaben.

Zusammengefasstes Denken

Mit aktiviertem erweiterten Denken gibt die Messages API für Claude 4-Modelle eine Zusammenfassung von Claudes vollständigem Denkprozess zurück. Zusammengefasstes Denken bietet die vollen Intelligenzvorteile des erweiterten Denkens und verhindert gleichzeitig Missbrauch. Während die API bei Claude 3.7- und 4-Modellen konsistent ist, können Streaming-Antworten für erweitertes Denken in einem “klumpigen” Liefermuster zurückkehren, mit möglichen Verzögerungen zwischen Streaming-Ereignissen.
Die Zusammenfassung wird von einem anderen Modell verarbeitet als dem, das Sie in Ihren Anfragen anvisieren. Das Denkmodell sieht die zusammengefasste Ausgabe nicht.
Für weitere Informationen siehe die Erweiterte Denk-Dokumentation.

Verschachteltes Denken

Claude 4-Modelle unterstützen die Verschachtelung von Tool-Nutzung mit erweitertem Denken, was natürlichere Gespräche ermöglicht, bei denen Tool-Nutzungen und Antworten mit regulären Nachrichten gemischt werden können.
Verschachteltes Denken ist in der Beta. Um verschachteltes Denken zu aktivieren, fügen Sie den Beta-Header interleaved-thinking-2025-05-14 zu Ihrer API-Anfrage hinzu.
Für weitere Informationen siehe die Erweiterte Denk-Dokumentation.

Verhaltensunterschiede

Claude 4-Modelle haben bemerkenswerte Verhaltensänderungen, die beeinflussen können, wie Sie Prompts strukturieren:

Kommunikationsstil-Änderungen

  • Prägnanter und direkter: Claude 4-Modelle kommunizieren effizienter, mit weniger ausführlichen Erklärungen
  • Natürlicherer Ton: Antworten sind etwas gesprächiger und weniger maschinenähnlich
  • Effizienz-fokussiert: Kann detaillierte Zusammenfassungen nach dem Abschluss von Aktionen überspringen, um den Workflow-Schwung aufrechtzuerhalten (Sie können nach mehr Details fragen, wenn nötig)

Anweisungsbefolgung

Claude 4-Modelle sind für präzise Anweisungsbefolgung trainiert und erfordern explizitere Anweisungen:
  • Seien Sie explizit über Aktionen: Verwenden Sie direkte Sprache wie “Machen Sie diese Änderungen” oder “Implementieren Sie diese Funktion” anstatt “Können Sie Änderungen vorschlagen”, wenn Sie möchten, dass Claude Maßnahmen ergreift
  • Geben Sie gewünschte Verhaltensweisen klar an: Claude wird Anweisungen präzise befolgen, daher hilft es, spezifisch über das zu sein, was Sie wollen, um bessere Ergebnisse zu erzielen
Für umfassende Anleitung zur Arbeit mit diesen Modellen siehe Claude 4 Prompt Engineering Best Practices.

Aktualisiertes Texteditor-Tool

Das Texteditor-Tool wurde für Claude 4-Modelle mit den folgenden Änderungen aktualisiert:
  • Tool-Typ: text_editor_20250728
  • Tool-Name: str_replace_based_edit_tool
  • Der undo_edit-Befehl wird nicht mehr unterstützt
Das str_replace_editor Texteditor-Tool bleibt für Claude Sonnet 3.7 gleich.
Wenn Sie von Claude Sonnet 3.7 migrieren und das Texteditor-Tool verwenden:
# Claude Sonnet 3.7
tools=[
    {
        "type": "text_editor_20250124",
        "name": "str_replace_editor"
    }
]

# Claude 4-Modelle
tools=[
    {
        "type": "text_editor_20250728",
        "name": "str_replace_based_edit_tool"
    }
]
Für weitere Informationen siehe die Texteditor-Tool-Dokumentation.

Aktualisiertes Code-Ausführungs-Tool

Wenn Sie das Code-Ausführungs-Tool verwenden, stellen Sie sicher, dass Sie die neueste Version code_execution_20250825 verwenden, die Bash-Befehle und Dateimanipulationsfähigkeiten hinzufügt. Die Legacy-Version code_execution_20250522 (nur Python) ist noch verfügbar, aber nicht für neue Implementierungen empfohlen. Für Migrationsanweisungen siehe die Code-Ausführungs-Tool-Dokumentation.

Preise und Verfügbarkeit

Preise

Claude 4.5-Modelle behalten wettbewerbsfähige Preise bei:
ModellEingabeAusgabe
Claude Sonnet 4.53 $ pro Million Token15 $ pro Million Token
Claude Haiku 4.51 $ pro Million Token5 $ pro Million Token
Für weitere Details siehe die Preis-Dokumentation.

Drittanbieter-Plattform-Preise

Ab Claude 4.5-Modellen (Sonnet 4.5 und Haiku 4.5) bieten AWS Bedrock und Google Vertex AI zwei Endpunkt-Typen:
  • Globale Endpunkte: Dynamisches Routing für maximale Verfügbarkeit
  • Regionale Endpunkte: Garantiertes Datenrouting durch spezifische geografische Regionen mit einem 10% Preisaufschlag
Diese regionale Preisgestaltung gilt sowohl für Claude Sonnet 4.5 als auch für Claude Haiku 4.5. Die Claude API (1P) ist standardmäßig global und von dieser Änderung nicht betroffen. Die Claude API ist nur global (entspricht dem globalen Endpunkt-Angebot und der Preisgestaltung anderer Anbieter). Für Implementierungsdetails und Migrationsleitfaden:

Verfügbarkeit

Claude 4.5-Modelle sind verfügbar auf:
ModellClaude APIAmazon BedrockGoogle Cloud Vertex AI
Claude Sonnet 4.5claude-sonnet-4-5-20250929anthropic.claude-sonnet-4-5-20250929-v1:0claude-sonnet-4-5@20250929
Claude Haiku 4.5claude-haiku-4-5-20251001anthropic.claude-haiku-4-5-20251001-v1:0claude-haiku-4-5@20251001
Auch verfügbar über Claude.ai und Claude Code-Plattformen.

Migrationsleitfaden

Breaking Changes und Migrationsanforderungen variieren je nachdem, von welchem Modell Sie upgraden. Für detaillierte Migrationsanweisungen, einschließlich schrittweiser Anleitungen, Breaking Changes und Migrations-Checklisten, siehe Migration zu Claude 4.5. Der Migrationsleitfaden deckt die folgenden Szenarien ab:
  • Claude Sonnet 3.7 → Sonnet 4.5: Vollständiger Migrationspfad mit Breaking Changes
  • Claude Haiku 3.5 → Haiku 4.5: Vollständiger Migrationspfad mit Breaking Changes
  • Claude Sonnet 4 → Sonnet 4.5: Schnelles Upgrade mit minimalen Änderungen
  • Claude Opus 4.1 → Sonnet 4.5: Nahtloses Upgrade ohne Breaking Changes

Nächste Schritte