Claude 4.5 introduit deux modèles conçus pour différents cas d’usage :
  • Claude Sonnet 4.5 : Notre meilleur modèle pour les agents complexes et le codage, avec la plus haute intelligence sur la plupart des tâches
  • Claude Haiku 4.5 : Notre modèle Haiku le plus rapide et le plus intelligent avec des performances quasi-frontières. Le premier modèle Haiku avec pensée étendue

Améliorations clés dans Sonnet 4.5 par rapport à Sonnet 4

Excellence en codage

Claude Sonnet 4.5 est notre meilleur modèle de codage à ce jour, avec des améliorations significatives sur l’ensemble du cycle de développement :
  • Performance SWE-bench Verified : État de l’art avancé sur les benchmarks de codage
  • Planification et conception système améliorées : Meilleures décisions architecturales et organisation du code
  • Ingénierie de sécurité améliorée : Pratiques de sécurité plus robustes et détection des vulnérabilités
  • Meilleur suivi des instructions : Adhésion plus précise aux spécifications et exigences de codage
Claude Sonnet 4.5 performe significativement mieux sur les tâches de codage lorsque la pensée étendue est activée. La pensée étendue est désactivée par défaut, mais nous recommandons de l’activer pour les travaux de codage complexes. Soyez conscient que la pensée étendue impacte l’efficacité de la mise en cache des prompts. Voir le guide de migration pour les détails de configuration.

Capacités d’agent

Claude Sonnet 4.5 introduit des avancées majeures dans les capacités d’agent :
  • Fonctionnement autonome étendu : Sonnet 4.5 peut travailler de manière indépendante pendant des heures tout en maintenant la clarté et la concentration sur les progrès incrémentaux. Le modèle fait des avancées constantes sur quelques tâches à la fois plutôt que d’essayer tout à la fois. Il fournit des mises à jour de progrès basées sur les faits qui reflètent fidèlement ce qui a été accompli.
  • Conscience du contexte : Claude suit maintenant son utilisation de tokens tout au long des conversations, recevant des mises à jour après chaque appel d’outil. Cette conscience aide à prévenir l’abandon prématuré des tâches et permet une exécution plus efficace sur les tâches de longue durée. Voir Conscience du contexte pour les détails techniques et les conseils de prompting.
  • Utilisation d’outils améliorée : Le modèle utilise plus efficacement les appels d’outils parallèles, lançant plusieurs recherches spéculatives simultanément pendant la recherche et lisant plusieurs fichiers à la fois pour construire le contexte plus rapidement. Une coordination améliorée entre plusieurs outils et sources d’information permet au modèle d’exploiter efficacement une large gamme de capacités dans les flux de travail de recherche agentique et de codage.
  • Gestion de contexte avancée : Sonnet 4.5 maintient un suivi d’état exceptionnel dans les fichiers externes, préservant l’orientation vers les objectifs entre les sessions. Combiné avec une utilisation plus efficace de la fenêtre de contexte et nos nouvelles fonctionnalités d’API de gestion de contexte, le modèle gère de manière optimale les informations sur des sessions étendues pour maintenir la cohérence dans le temps.
La conscience du contexte est disponible dans Claude Sonnet 4, Sonnet 4.5, Haiku 4.5, Opus 4, et Opus 4.1.

Communication et style d’interaction

Claude Sonnet 4.5 a une approche de communication raffinée qui est concise, directe et naturelle. Il fournit des mises à jour de progrès basées sur les faits et peut omettre les résumés verbeux après les appels d’outils pour maintenir l’élan du flux de travail (bien que cela puisse être ajusté avec le prompting). Pour des conseils détaillés sur le travail avec ce style de communication, voir Meilleures pratiques Claude 4.

Génération de contenu créatif

Claude Sonnet 4.5 excelle dans les tâches de contenu créatif :
  • Présentations et animations : Égale ou dépasse Claude Opus 4.1 pour créer des diapositives et du contenu visuel
  • Flair créatif : Produit des sorties polies et professionnelles avec un fort suivi des instructions
  • Qualité au premier essai : Génère du contenu utilisable et bien conçu dès les premières tentatives

Améliorations clés dans Haiku 4.5 par rapport à Haiku 3.5

Claude Haiku 4.5 représente un bond transformateur pour la famille de modèles Haiku, apportant des capacités frontières à notre classe de modèles la plus rapide :

Intelligence quasi-frontière avec une vitesse fulgurante

Claude Haiku 4.5 offre des performances quasi-frontières égalant Sonnet 4 à un coût significativement plus bas et une vitesse plus rapide :
  • Intelligence quasi-frontière : Égale les performances de Sonnet 4 sur le raisonnement, le codage et les tâches complexes
  • Vitesse améliorée : Plus de deux fois la vitesse de Sonnet 4, avec des optimisations pour les tokens de sortie par seconde (OTPS)
  • Rapport coût-performance optimal : Intelligence quasi-frontière à un tiers du coût, idéal pour les déploiements à haut volume

Capacités de pensée étendue

Claude Haiku 4.5 est le premier modèle Haiku à supporter la pensée étendue, apportant des capacités de raisonnement avancées à la famille Haiku :
  • Raisonnement à vitesse : Accès au processus de raisonnement interne de Claude pour la résolution de problèmes complexes
  • Résumé de pensée : Sortie de pensée résumée pour les déploiements prêts pour la production
  • Pensée entrelacée : Penser entre les appels d’outils pour des flux de travail multi-étapes plus sophistiqués
  • Contrôle du budget : Configurer les budgets de tokens de pensée pour équilibrer la profondeur de raisonnement avec la vitesse
La pensée étendue doit être activée explicitement en ajoutant un paramètre thinking à vos requêtes API. Voir la documentation de la pensée étendue pour les détails d’implémentation.
Claude Haiku 4.5 performe significativement mieux sur les tâches de codage et de raisonnement lorsque la pensée étendue est activée. La pensée étendue est désactivée par défaut, mais nous recommandons de l’activer pour la résolution de problèmes complexes, le travail de codage et le raisonnement multi-étapes. Soyez conscient que la pensée étendue impacte l’efficacité de la mise en cache des prompts. Voir le guide de migration pour les détails de configuration.
Disponible dans Claude Sonnet 3.7, Sonnet 4, Sonnet 4.5, Haiku 4.5, Opus 4, et Opus 4.1.

Conscience du contexte

Claude Haiku 4.5 dispose de la conscience du contexte, permettant au modèle de suivre sa fenêtre de contexte restante tout au long d’une conversation :
  • Suivi du budget de tokens : Claude reçoit des mises à jour en temps réel sur la capacité de contexte restante après chaque appel d’outil
  • Meilleure persistance des tâches : Le modèle peut exécuter les tâches plus efficacement en comprenant l’espace de travail disponible
  • Flux de travail multi-fenêtres de contexte : Gestion améliorée des transitions d’état sur des sessions étendues
C’est le premier modèle Haiku avec des capacités natives de conscience du contexte. Pour les conseils de prompting, voir Meilleures pratiques Claude 4.
Disponible dans Claude Sonnet 4, Sonnet 4.5, Haiku 4.5, Opus 4, et Opus 4.1.

Codage solide et utilisation d’outils

Claude Haiku 4.5 offre des capacités de codage robustes attendues des modèles Claude modernes :
  • Compétence en codage : Performance solide sur les tâches de génération de code, débogage et refactorisation
  • Support complet d’outils : Compatible avec tous les outils Claude 4 incluant bash, exécution de code, éditeur de texte, recherche web et utilisation d’ordinateur
  • Utilisation d’ordinateur améliorée : Optimisé pour l’interaction autonome de bureau et les flux de travail d’automatisation de navigateur
  • Exécution d’outils parallèles : Coordination efficace entre plusieurs outils pour des flux de travail complexes
Haiku 4.5 est conçu pour les cas d’usage qui demandent à la fois intelligence et efficacité :
  • Applications temps réel : Temps de réponse rapides pour les expériences utilisateur interactives
  • Traitement à haut volume : Intelligence rentable pour les déploiements à grande échelle
  • Implémentations de niveau gratuit : Qualité de modèle premium à prix accessible
  • Architectures de sous-agents : Agents rapides et intelligents pour les systèmes multi-agents
  • Utilisation d’ordinateur à grande échelle : Automatisation autonome de bureau et navigateur rentable

Nouvelles fonctionnalités API

Outil mémoire (Bêta)

Le nouvel outil mémoire permet à Claude de stocker et récupérer des informations en dehors de la fenêtre de contexte :
tools=[
    {
        "type": "memory_20250818",
        "name": "memory"
    }
]
Cela permet :
  • Construire des bases de connaissances au fil du temps
  • Maintenir l’état du projet entre les sessions
  • Préserver un contexte effectivement illimité grâce au stockage basé sur fichiers
Disponible dans Claude Sonnet 4, Sonnet 4.5, Haiku 4.5, Opus 4, et Opus 4.1. Nécessite l’en-tête bêta : context-management-2025-06-27

Édition de contexte

Utilisez l’édition de contexte pour une gestion intelligente du contexte grâce à l’effacement automatique des appels d’outils :
response = client.beta.messages.create(
    betas=["context-management-2025-06-27"],
    model="claude-sonnet-4-5",  # ou claude-haiku-4-5
    max_tokens=4096,
    messages=[{"role": "user", "content": "..."}],
    context_management={
        "edits": [
            {
                "type": "clear_tool_uses_20250919",
                "trigger": {"type": "input_tokens", "value": 500},
                "keep": {"type": "tool_uses", "value": 2},
                "clear_at_least": {"type": "input_tokens", "value": 100}
            }
        ]
    },
    tools=[...]
)
Cette fonctionnalité supprime automatiquement les anciens appels d’outils et résultats lors de l’approche des limites de tokens, aidant à gérer le contexte dans les sessions d’agents de longue durée.
Disponible dans Claude Sonnet 4, Sonnet 4.5, Haiku 4.5, Opus 4, et Opus 4.1. Nécessite l’en-tête bêta : context-management-2025-06-27

Raisons d’arrêt améliorées

Les modèles Claude 4.5 introduisent une nouvelle raison d’arrêt model_context_window_exceeded qui indique explicitement quand la génération s’est arrêtée en raison d’avoir atteint la limite de la fenêtre de contexte, plutôt que la limite max_tokens demandée. Cela facilite la gestion des limites de fenêtre de contexte dans votre logique d’application.
{
  "stop_reason": "model_context_window_exceeded",
  "usage": {
    "input_tokens": 150000,
    "output_tokens": 49950
  }
}

Gestion améliorée des paramètres d’outils

Les modèles Claude 4.5 incluent une correction de bug qui préserve le formatage intentionnel dans les paramètres de chaîne des appels d’outils. Auparavant, les nouvelles lignes de fin dans les paramètres de chaîne étaient parfois incorrectement supprimées. Cette correction garantit que les outils nécessitant un formatage précis (comme les éditeurs de texte) reçoivent les paramètres exactement comme prévu.
Il s’agit d’une amélioration en arrière-plan sans changements d’API requis. Cependant, les outils avec des paramètres de chaîne peuvent maintenant recevoir des valeurs avec des nouvelles lignes de fin qui étaient auparavant supprimées.
Exemple :
// Avant : Nouvelle ligne finale accidentellement supprimée
{
  "type": "tool_use",
  "id": "toolu_01A09q90qw90lq917835lq9",
  "name": "edit_todo",
  "input": {
    "file": "todo.txt",
    "contents": "1. Chop onions.\n2. ???\n3. Profit"
  }
}

// Après : Nouvelle ligne de fin préservée comme prévu
{
  "type": "tool_use",
  "id": "toolu_01A09q90qw90lq917835lq9",
  "name": "edit_todo",
  "input": {
    "file": "todo.txt",
    "contents": "1. Chop onions.\n2. ???\n3. Profit\n"
  }
}

Optimisations du nombre de tokens

Les modèles Claude 4.5 incluent des optimisations automatiques pour améliorer les performances du modèle. Ces optimisations peuvent ajouter de petites quantités de tokens aux requêtes, mais vous n’êtes pas facturé pour ces tokens ajoutés par le système.

Fonctionnalités introduites dans Claude 4

Les fonctionnalités suivantes ont été introduites dans Claude 4 et sont disponibles sur tous les modèles Claude 4, incluant Claude Sonnet 4.5 et Claude Haiku 4.5.

Nouvelle raison d’arrêt de refus

Les modèles Claude 4 introduisent une nouvelle raison d’arrêt refusal pour le contenu que le modèle refuse de générer pour des raisons de sécurité :
{"id":"msg_014XEDjypDjFzgKVWdFUXxZP",
"type":"message",
"role":"assistant",
"model":"claude-sonnet-4-5",
"content":[{"type":"text","text":"I would be happy to assist you. You can "}],
"stop_reason":"refusal",
"stop_sequence":null,
"usage":{"input_tokens":564,"cache_creation_input_tokens":0,"cache_read_input_tokens":0,"output_tokens":22}
}
Lors de l’utilisation des modèles Claude 4, vous devriez mettre à jour votre application pour gérer les raisons d’arrêt refusal.

Pensée résumée

Avec la pensée étendue activée, l’API Messages pour les modèles Claude 4 retourne un résumé du processus de pensée complet de Claude. La pensée résumée fournit tous les bénéfices d’intelligence de la pensée étendue, tout en prévenant les mauvais usages. Bien que l’API soit cohérente entre les modèles Claude 3.7 et 4, les réponses en streaming pour la pensée étendue peuvent retourner dans un modèle de livraison “par blocs”, avec des délais possibles entre les événements de streaming.
La résumé est traité par un modèle différent de celui que vous ciblez dans vos requêtes. Le modèle de pensée ne voit pas la sortie résumée.
Pour plus d’informations, voir la documentation de la pensée étendue.

Pensée entrelacée

Les modèles Claude 4 supportent l’entrelacement de l’utilisation d’outils avec la pensée étendue, permettant des conversations plus naturelles où les utilisations d’outils et les réponses peuvent être mélangées avec des messages réguliers.
La pensée entrelacée est en bêta. Pour activer la pensée entrelacée, ajoutez l’en-tête bêta interleaved-thinking-2025-05-14 à votre requête API.
Pour plus d’informations, voir la documentation de la pensée étendue.

Différences comportementales

Les modèles Claude 4 ont des changements comportementaux notables qui peuvent affecter la façon dont vous structurez les prompts :

Changements de style de communication

  • Plus concis et direct : Les modèles Claude 4 communiquent plus efficacement, avec des explications moins verbeuses
  • Ton plus naturel : Les réponses sont légèrement plus conversationnelles et moins mécaniques
  • Axé sur l’efficacité : Peut omettre les résumés détaillés après avoir terminé des actions pour maintenir l’élan du flux de travail (vous pouvez demander plus de détails si nécessaire)

Suivi des instructions

Les modèles Claude 4 sont entraînés pour un suivi précis des instructions et nécessitent une direction plus explicite :
  • Soyez explicite sur les actions : Utilisez un langage direct comme “Faites ces changements” ou “Implémentez cette fonctionnalité” plutôt que “Pouvez-vous suggérer des changements” si vous voulez que Claude prenne des mesures
  • Énoncez clairement les comportements souhaités : Claude suivra les instructions précisément, donc être spécifique sur ce que vous voulez aide à obtenir de meilleurs résultats
Pour des conseils complets sur le travail avec ces modèles, voir Meilleures pratiques d’ingénierie de prompts Claude 4.

Outil éditeur de texte mis à jour

L’outil éditeur de texte a été mis à jour pour les modèles Claude 4 avec les changements suivants :
  • Type d’outil : text_editor_20250728
  • Nom d’outil : str_replace_based_edit_tool
  • La commande undo_edit n’est plus supportée
L’outil éditeur de texte str_replace_editor reste le même pour Claude Sonnet 3.7.
Si vous migrez depuis Claude Sonnet 3.7 et utilisez l’outil éditeur de texte :
# Claude Sonnet 3.7
tools=[
    {
        "type": "text_editor_20250124",
        "name": "str_replace_editor"
    }
]

# Modèles Claude 4
tools=[
    {
        "type": "text_editor_20250728",
        "name": "str_replace_based_edit_tool"
    }
]
Pour plus d’informations, voir la documentation de l’outil éditeur de texte.

Outil d’exécution de code mis à jour

Si vous utilisez l’outil d’exécution de code, assurez-vous d’utiliser la dernière version code_execution_20250825, qui ajoute les commandes Bash et les capacités de manipulation de fichiers. La version héritée code_execution_20250522 (Python seulement) est toujours disponible mais non recommandée pour les nouvelles implémentations. Pour les instructions de migration, voir la documentation de l’outil d’exécution de code.

Tarification et disponibilité

Tarification

Les modèles Claude 4.5 maintiennent une tarification compétitive :
ModèleEntréeSortie
Claude Sonnet 4.53 $ par million de tokens15 $ par million de tokens
Claude Haiku 4.51 $ par million de tokens5 $ par million de tokens
Pour plus de détails, voir la documentation de tarification.

Tarification des plateformes tierces

À partir des modèles Claude 4.5 (Sonnet 4.5 et Haiku 4.5), AWS Bedrock et Google Vertex AI offrent deux types de points de terminaison :
  • Points de terminaison globaux : Routage dynamique pour une disponibilité maximale
  • Points de terminaison régionaux : Routage de données garanti à travers des régions géographiques spécifiques avec une prime de tarification de 10%
Cette tarification régionale s’applique à la fois à Claude Sonnet 4.5 et Claude Haiku 4.5. L’API Claude (1P) est globale par défaut et non affectée par ce changement. L’API Claude est globale uniquement (équivalente à l’offre de point de terminaison global et à la tarification des autres fournisseurs). Pour les détails d’implémentation et les conseils de migration :

Disponibilité

Les modèles Claude 4.5 sont disponibles sur :
ModèleAPI ClaudeAmazon BedrockGoogle Cloud Vertex AI
Claude Sonnet 4.5claude-sonnet-4-5-20250929anthropic.claude-sonnet-4-5-20250929-v1:0claude-sonnet-4-5@20250929
Claude Haiku 4.5claude-haiku-4-5-20251001anthropic.claude-haiku-4-5-20251001-v1:0claude-haiku-4-5@20251001
Également disponible via les plateformes Claude.ai et Claude Code.

Guide de migration

Les changements cassants et les exigences de migration varient selon le modèle depuis lequel vous effectuez la mise à niveau. Pour des instructions de migration détaillées, incluant des guides étape par étape, les changements cassants et les listes de vérification de migration, voir Migration vers Claude 4.5. Le guide de migration couvre les scénarios suivants :
  • Claude Sonnet 3.7 → Sonnet 4.5 : Chemin de migration complet avec changements cassants
  • Claude Haiku 3.5 → Haiku 4.5 : Chemin de migration complet avec changements cassants
  • Claude Sonnet 4 → Sonnet 4.5 : Mise à niveau rapide avec changements minimaux
  • Claude Opus 4.1 → Sonnet 4.5 : Mise à niveau transparente sans changements cassants

Prochaines étapes