Améliorations clés par rapport à Sonnet 4

Excellence en codage

Claude Sonnet 4.5 est notre meilleur modèle de codage à ce jour, avec des améliorations significatives dans tout le cycle de vie de développement :
  • Performance SWE-bench Verified : État de l’art avancé sur les benchmarks de codage
  • Planification et conception de système améliorées : Meilleures décisions architecturales et organisation du code
  • Ingénierie de sécurité améliorée : Pratiques de sécurité plus robustes et détection de vulnérabilités
  • Meilleur suivi des instructions : Adhésion plus précise aux spécifications et exigences de codage
Réflexion étendue pour des performances optimales : Claude Sonnet 4.5 performe significativement mieux sur les tâches de codage lorsque la réflexion étendue est activée. La réflexion étendue est désactivée par défaut, mais nous recommandons de l’activer pour les travaux de codage complexes. Sachez que la réflexion étendue impacte l’efficacité de mise en cache des prompts. Voir le guide de migration pour les détails de configuration.

Capacités d’agent

Claude Sonnet 4.5 introduit des avancées majeures dans les capacités d’agent :
  • Fonctionnement autonome étendu : Sonnet 4.5 peut travailler de manière indépendante pendant des heures tout en maintenant la clarté et la concentration sur les progrès incrémentaux. Le modèle fait des avancées constantes sur quelques tâches à la fois plutôt que de tout tenter en même temps. Il fournit des mises à jour de progrès basées sur les faits qui reflètent fidèlement ce qui a été accompli.
  • Conscience du contexte : Claude suit maintenant son utilisation de tokens tout au long des conversations, recevant des mises à jour après chaque appel d’outil. Cette conscience aide à prévenir l’abandon prématuré des tâches et permet une exécution plus efficace sur les tâches de longue durée. Voir Conscience du contexte pour les détails techniques et conseils de prompting.
  • Utilisation d’outils améliorée : Le modèle utilise plus efficacement les appels d’outils parallèles, lançant plusieurs recherches spéculatives simultanément pendant la recherche et lisant plusieurs fichiers à la fois pour construire le contexte plus rapidement. Une coordination améliorée entre plusieurs outils et sources d’information permet au modèle d’exploiter efficacement une large gamme de capacités dans les flux de travail de recherche agentique et de codage.
  • Gestion de contexte avancée : Sonnet 4.5 maintient un suivi d’état exceptionnel dans les fichiers externes, préservant l’orientation vers les objectifs entre les sessions. Combiné avec une utilisation plus efficace de la fenêtre de contexte et nos nouvelles fonctionnalités d’API de gestion de contexte, le modèle gère de manière optimale les informations à travers des sessions étendues pour maintenir la cohérence dans le temps.

Communication et style d’interaction

Claude Sonnet 4.5 a une approche de communication raffinée qui est concise, directe et naturelle. Il fournit des mises à jour de progrès basées sur les faits et peut ignorer les résumés verbeux après les appels d’outils pour maintenir l’élan du flux de travail (bien que cela puisse être ajusté avec le prompting). Pour des conseils détaillés sur le travail avec ce style de communication, voir Meilleures pratiques Claude 4.

Génération de contenu créatif

Claude Sonnet 4.5 excelle dans les tâches de contenu créatif :
  • Présentations et animations : Égale ou dépasse Claude Opus 4.1 pour créer des diapositives et du contenu visuel
  • Flair créatif : Produit une sortie polie et professionnelle avec un fort suivi des instructions
  • Qualité du premier essai : Génère du contenu utilisable et bien conçu dès les premières tentatives

Nouvelles fonctionnalités API

Outil de mémoire (Bêta)

Le nouvel outil de mémoire permet à Claude de stocker et récupérer des informations en dehors de la fenêtre de contexte :
tools=[
    {
        "type": "memory_20250818",
        "name": "memory"
    }
]
Cela permet de :
  • Construire des bases de connaissances au fil du temps
  • Maintenir l’état du projet entre les sessions
  • Préserver un contexte effectivement illimité grâce au stockage basé sur fichiers
Nécessite l’en-tête bêta : context-management-2025-06-27

Édition de contexte

Claude Sonnet 4.5 introduit l’édition de contexte pour une gestion intelligente du contexte grâce à l’effacement automatique des appels d’outils :
response = client.beta.messages.create(
    betas=["context-management-2025-06-27"],
    model="claude-sonnet-4-5",
    max_tokens=4096,
    messages=[{"role": "user", "content": "..."}],
    context_management={
        "edits": [
            {
                "type": "clear_tool_uses_20250919",
                "trigger": {"type": "input_tokens", "value": 500},
                "keep": {"type": "tool_uses", "value": 2},
                "clear_at_least": {"type": "input_tokens", "value": 100}
            }
        ]
    },
    tools=[...]
)
Cette fonctionnalité supprime automatiquement les anciens appels d’outils et résultats lors de l’approche des limites de tokens, aidant à gérer le contexte dans les sessions d’agent de longue durée.

Raisons d’arrêt améliorées

Claude Sonnet 4.5 introduit une nouvelle raison d’arrêt model_context_window_exceeded qui indique explicitement quand la génération s’est arrêtée en raison d’avoir atteint la limite de la fenêtre de contexte, plutôt que la limite max_tokens demandée. Cela facilite la gestion des limites de fenêtre de contexte dans votre logique d’application.
{
  "stop_reason": "model_context_window_exceeded",
  "usage": {
    "input_tokens": 150000,
    "output_tokens": 49950
  }
}

Gestion améliorée des paramètres d’outils

Claude Sonnet 4.5 inclut une correction de bug qui préserve le formatage intentionnel dans les paramètres de chaîne d’appel d’outil. Auparavant, les nouvelles lignes de fin dans les paramètres de chaîne étaient parfois incorrectement supprimées. Cette correction garantit que les outils nécessitant un formatage précis (comme les éditeurs de texte) reçoivent les paramètres exactement comme prévu.
Il s’agit d’une amélioration en arrière-plan sans changements d’API requis. Cependant, les outils avec des paramètres de chaîne peuvent maintenant recevoir des valeurs avec des nouvelles lignes de fin qui étaient auparavant supprimées.
Exemple :
// Avant : Nouvelle ligne finale accidentellement supprimée
{
  "type": "tool_use",
  "id": "toolu_01A09q90qw90lq917835lq9",
  "name": "edit_todo",
  "input": {
    "file": "todo.txt",
    "contents": "1. Chop onions.\n2. ???\n3. Profit"
  }
}

// Après : Nouvelle ligne de fin préservée comme prévu
{
  "type": "tool_use",
  "id": "toolu_01A09q90qw90lq917835lq9",
  "name": "edit_todo",
  "input": {
    "file": "todo.txt",
    "contents": "1. Chop onions.\n2. ???\n3. Profit\n"
  }
}

Optimisations du nombre de tokens

Claude Sonnet 4.5 inclut des optimisations automatiques pour améliorer les performances du modèle. Ces optimisations peuvent ajouter de petites quantités de tokens aux requêtes, mais vous n’êtes pas facturé pour ces tokens ajoutés par le système.

Tarification et disponibilité

Tarification

Claude Sonnet 4.5 maintient la même tarification que Sonnet 4 :
  • Entrée : 3 $ par million de tokens
  • Sortie : 15 $ par million de tokens

Disponibilité

Claude Sonnet 4.5 est disponible sur :
  • API Claude : claude-sonnet-4-5-20250929
  • Amazon Bedrock : anthropic.claude-sonnet-4-5-20250929-v1:0
  • Google Cloud Vertex AI : claude-sonnet-4-5@20250929
Également disponible via les plateformes Claude.ai et Claude Code.

Guide de migration

Si vous utilisez actuellement Claude Sonnet 4, la mise à niveau vers Sonnet 4.5 est simple :
  1. Mettez à jour le nom de votre modèle vers claude-sonnet-4-5-20250929
  2. Les appels API existants continueront de fonctionner*
  3. Considérez l’activation des nouvelles fonctionnalités :
    • Outil de mémoire pour les agents de longue durée
    • Effacement des appels d’outils pour une meilleure gestion du contexte
Voir Migration vers Claude 4 pour des instructions de migration détaillées si vous migrez vers Sonnet 4.5 depuis un modèle Claude 3. * - Sonnet 4.5 ne permet pas de spécifier à la fois les paramètres temperature et top_p. Veuillez n’en utiliser qu’un seul.

Prochaines étapes