相比 Sonnet 4 的关键改进

编码卓越性

Claude Sonnet 4.5 是我们迄今为止最好的编码模型,在整个开发生命周期中都有显著改进:
  • SWE-bench Verified 性能:在编码基准测试中达到了先进的最新水平
  • 增强的规划和系统设计:更好的架构决策和代码组织
  • 改进的安全工程:更强大的安全实践和漏洞检测
  • 更好的指令遵循:更精确地遵循编码规范和要求
扩展思考以获得最佳性能:当启用扩展思考时,Claude Sonnet 4.5 在编码任务上的表现明显更好。扩展思考默认是禁用的,但我们建议在复杂编码工作中启用它。请注意,扩展思考会影响提示缓存效率。有关配置详细信息,请参阅迁移指南

代理能力

Claude Sonnet 4.5 在代理能力方面引入了重大进步:
  • 扩展自主操作:Sonnet 4.5 可以独立工作数小时,同时保持对增量进展的清晰度和专注度。该模型一次在少数任务上取得稳定进展,而不是试图同时处理所有事情。它提供基于事实的进度更新,准确反映已完成的工作。
  • 上下文感知:Claude 现在在整个对话过程中跟踪其令牌使用情况,在每次工具调用后接收更新。这种感知有助于防止过早放弃任务,并在长期运行的任务中实现更有效的执行。有关技术详细信息,请参阅上下文感知提示指导
  • 增强的工具使用:该模型更有效地使用并行工具调用,在研究期间同时启动多个推测性搜索,并一次阅读多个文件以更快地构建上下文。跨多个工具和信息源的改进协调使模型能够在代理搜索和编码工作流程中有效利用广泛的能力。
  • 高级上下文管理:Sonnet 4.5 在外部文件中保持出色的状态跟踪,在会话之间保持目标导向。结合更有效的上下文窗口使用和我们新的上下文管理 API 功能,该模型在扩展会话中最优地处理信息,以保持长期的连贯性。

沟通和交互风格

Claude Sonnet 4.5 具有精炼的沟通方式,简洁、直接且自然。它提供基于事实的进度更新,并可能在工具调用后跳过冗长的摘要以保持工作流程动力(尽管这可以通过提示进行调整)。 有关使用这种沟通风格的详细指导,请参阅 Claude 4 最佳实践

创意内容生成

Claude Sonnet 4.5 在创意内容任务方面表现出色:
  • 演示文稿和动画:在创建幻灯片和视觉内容方面与 Claude Opus 4.1 相匹配或超越
  • 创意天赋:产生精美、专业的输出,具有强大的指令遵循能力
  • 首次尝试质量:在初次尝试中生成可用、设计良好的内容

新的 API 功能

内存工具(Beta)

新的内存工具使 Claude 能够在上下文窗口之外存储和检索信息:
tools=[
    {
        "type": "memory_20250818",
        "name": "memory"
    }
]
这允许:
  • 随时间构建知识库
  • 在会话之间维护项目状态
  • 通过基于文件的存储保持有效无限的上下文
需要beta 头部context-management-2025-06-27

上下文编辑

Claude Sonnet 4.5 引入了上下文编辑,通过自动工具调用清理进行智能上下文管理:
response = client.beta.messages.create(
    betas=["context-management-2025-06-27"],
    model="claude-sonnet-4-5",
    max_tokens=4096,
    messages=[{"role": "user", "content": "..."}],
    context_management={
        "edits": [
            {
                "type": "clear_tool_uses_20250919",
                "trigger": {"type": "input_tokens", "value": 500},
                "keep": {"type": "tool_uses", "value": 2},
                "clear_at_least": {"type": "input_tokens", "value": 100}
            }
        ]
    },
    tools=[...]
)
此功能在接近令牌限制时自动删除较旧的工具调用和结果,有助于在长期运行的代理会话中管理上下文。

增强的停止原因

Claude Sonnet 4.5 引入了新的 model_context_window_exceeded 停止原因,明确指示生成因达到上下文窗口限制而停止,而不是请求的 max_tokens 限制。这使得在应用程序逻辑中处理上下文窗口限制变得更容易。
{
  "stop_reason": "model_context_window_exceeded",
  "usage": {
    "input_tokens": 150000,
    "output_tokens": 49950
  }
}

改进的工具参数处理

Claude Sonnet 4.5 包含一个错误修复,保留工具调用字符串参数中的有意格式。以前,字符串参数中的尾随换行符有时会被错误地删除。此修复确保需要精确格式的工具(如文本编辑器)完全按预期接收参数。
这是一个幕后改进,不需要 API 更改。但是,具有字符串参数的工具现在可能会接收到以前被删除的尾随换行符的值。
示例:
// 之前:最终换行符意外被删除
{
  "type": "tool_use",
  "id": "toolu_01A09q90qw90lq917835lq9",
  "name": "edit_todo",
  "input": {
    "file": "todo.txt",
    "contents": "1. Chop onions.\n2. ???\n3. Profit"
  }
}

// 之后:尾随换行符按预期保留
{
  "type": "tool_use",
  "id": "toolu_01A09q90qw90lq917835lq9",
  "name": "edit_todo",
  "input": {
    "file": "todo.txt",
    "contents": "1. Chop onions.\n2. ???\n3. Profit\n"
  }
}

令牌计数优化

Claude Sonnet 4.5 包含自动优化以提高模型性能。这些优化可能会向请求添加少量令牌,但您不会为这些系统添加的令牌付费

定价和可用性

定价

Claude Sonnet 4.5 保持与 Sonnet 4 相同的定价:
  • 输入:每百万令牌 3 美元
  • 输出:每百万令牌 15 美元

可用性

Claude Sonnet 4.5 可在以下平台使用:
  • Claude APIclaude-sonnet-4-5-20250929
  • Amazon Bedrockanthropic.claude-sonnet-4-5-20250929-v1:0
  • Google Cloud Vertex AIclaude-sonnet-4-5@20250929
也可通过 Claude.ai 和 Claude Code 平台使用。

迁移指南

如果您当前正在使用 Claude Sonnet 4,升级到 Sonnet 4.5 很简单:
  1. 将您的模型名称更新为 claude-sonnet-4-5-20250929
  2. 现有的 API 调用将继续工作*
  3. 考虑启用新功能:
    • 用于长期运行代理的内存工具
    • 用于更好上下文管理的工具调用清理
如果从 Claude 3 模型迁移到 Sonnet 4.5,请参阅迁移到 Claude 4 获取详细的迁移说明。 * - Sonnet 4.5 不允许同时指定 temperaturetop_p 参数。请只使用其中一个。

后续步骤