Claude 4.5 引入了两个针对不同用例设计的模型:
  • Claude Sonnet 4.5:我们用于复杂代理和编程的最佳模型,在大多数任务中具有最高的智能水平
  • Claude Haiku 4.5:我们最快且最智能的 Haiku 模型,具有接近前沿的性能。第一个支持扩展思维的 Haiku 模型

Sonnet 4.5 相比 Sonnet 4 的关键改进

编程卓越性

Claude Sonnet 4.5 是我们迄今为止最好的编程模型,在整个开发生命周期中都有显著改进:
  • SWE-bench Verified 性能:在编程基准测试中达到先进的最新水平
  • 增强的规划和系统设计:更好的架构决策和代码组织
  • 改进的安全工程:更强大的安全实践和漏洞检测
  • 更好的指令遵循:更精确地遵循编程规范和要求
当启用扩展思维时,Claude Sonnet 4.5 在编程任务上的表现显著更好。扩展思维默认是禁用的,但我们建议在复杂的编程工作中启用它。请注意,扩展思维会影响提示缓存效率。有关配置详细信息,请参阅迁移指南

代理能力

Claude Sonnet 4.5 在代理能力方面引入了重大进步:
  • 扩展的自主操作:Sonnet 4.5 可以独立工作数小时,同时保持清晰度并专注于增量进展。该模型一次在少数任务上取得稳定进展,而不是试图同时处理所有事情。它提供基于事实的进度更新,准确反映已完成的工作。
  • 上下文感知:Claude 现在在整个对话过程中跟踪其令牌使用情况,在每次工具调用后接收更新。这种感知有助于防止过早放弃任务,并在长时间运行的任务上实现更有效的执行。有关技术详细信息,请参阅上下文感知提示指导
  • 增强的工具使用:该模型更有效地使用并行工具调用,在研究期间同时启动多个推测性搜索,并同时阅读多个文件以更快地构建上下文。跨多个工具和信息源的改进协调使模型能够在代理搜索和编程工作流中有效利用广泛的能力。
  • 高级上下文管理:Sonnet 4.5 在外部文件中保持出色的状态跟踪,在会话间保持目标导向。结合更有效的上下文窗口使用和我们新的上下文管理 API 功能,该模型最优地处理扩展会话中的信息,以保持长期的连贯性。
上下文感知在 Claude Sonnet 4、Sonnet 4.5、Haiku 4.5、Opus 4 和 Opus 4.1 中可用。

沟通和交互风格

Claude Sonnet 4.5 具有精炼的沟通方式,简洁、直接且自然。它提供基于事实的进度更新,可能会跳过工具调用后的冗长摘要以保持工作流动力(尽管这可以通过提示进行调整)。 有关使用这种沟通风格的详细指导,请参阅Claude 4 最佳实践

创意内容生成

Claude Sonnet 4.5 在创意内容任务中表现出色:
  • 演示文稿和动画:在创建幻灯片和视觉内容方面匹配或超越 Claude Opus 4.1
  • 创意天赋:产生精美、专业的输出,具有强大的指令遵循能力
  • 首次尝试质量:在初次尝试中生成可用的、设计良好的内容

Haiku 4.5 相比 Haiku 3.5 的关键改进

Claude Haiku 4.5 代表了 Haiku 模型系列的变革性飞跃,为我们最快的模型类别带来了前沿能力:

接近前沿的智能与极快速度

Claude Haiku 4.5 以显著更低的成本和更快的速度提供匹配 Sonnet 4 的接近前沿性能:
  • 接近前沿的智能:在推理、编程和复杂任务中匹配 Sonnet 4 的性能
  • 增强的速度:比 Sonnet 4 快两倍以上,优化了每秒输出令牌数(OTPS)
  • 最优的成本性能:以三分之一的成本提供接近前沿的智能,非常适合大容量部署

扩展思维能力

Claude Haiku 4.5 是第一个支持扩展思维的 Haiku 模型,为 Haiku 系列带来了高级推理能力:
  • 高速推理:访问 Claude 的内部推理过程进行复杂问题解决
  • 思维摘要:为生产就绪部署提供摘要思维输出
  • 交错思维:在工具调用之间进行思考,实现更复杂的多步骤工作流
  • 预算控制:配置思维令牌预算以平衡推理深度与速度
扩展思维必须通过在 API 请求中添加 thinking 参数来显式启用。有关实现详细信息,请参阅扩展思维文档
当启用扩展思维时,Claude Haiku 4.5 在编程和推理任务上的表现显著更好。扩展思维默认是禁用的,但我们建议在复杂问题解决、编程工作和多步骤推理中启用它。请注意,扩展思维会影响提示缓存效率。有关配置详细信息,请参阅迁移指南
在 Claude Sonnet 3.7、Sonnet 4、Sonnet 4.5、Haiku 4.5、Opus 4 和 Opus 4.1 中可用。

上下文感知

Claude Haiku 4.5 具有上下文感知功能,使模型能够在整个对话过程中跟踪其剩余的上下文窗口:
  • 令牌预算跟踪:Claude 在每次工具调用后接收关于剩余上下文容量的实时更新
  • 更好的任务持久性:模型可以通过了解可用的工作空间更有效地执行任务
  • 多上下文窗口工作流:改进了跨扩展会话的状态转换处理
这是第一个具有原生上下文感知能力的 Haiku 模型。有关提示指导,请参阅Claude 4 最佳实践
在 Claude Sonnet 4、Sonnet 4.5、Haiku 4.5、Opus 4 和 Opus 4.1 中可用。

强大的编程和工具使用

Claude Haiku 4.5 提供现代 Claude 模型期望的强大编程能力:
  • 编程熟练度:在代码生成、调试和重构任务中表现强劲
  • 完整工具支持:与所有 Claude 4 工具兼容,包括 bash、代码执行、文本编辑器、网络搜索和计算机使用
  • 增强的计算机使用:针对自主桌面交互和浏览器自动化工作流进行了优化
  • 并行工具执行:跨多个工具的高效协调,用于复杂工作流
Haiku 4.5 专为需要智能和效率的用例而设计:
  • 实时应用:为交互式用户体验提供快速响应时间
  • 大容量处理:为大规模部署提供成本效益的智能
  • 免费层实现:以可访问的价格提供高级模型质量
  • 子代理架构:为多代理系统提供快速、智能的代理
  • 大规模计算机使用:成本效益的自主桌面和浏览器自动化

新的 API 功能

内存工具(Beta)

新的内存工具使 Claude 能够在上下文窗口之外存储和检索信息:
tools=[
    {
        "type": "memory_20250818",
        "name": "memory"
    }
]
这允许:
  • 随时间构建知识库
  • 跨会话维护项目状态
  • 通过基于文件的存储保持有效无限的上下文
在 Claude Sonnet 4、Sonnet 4.5、Haiku 4.5、Opus 4 和 Opus 4.1 中可用。需要beta 头context-management-2025-06-27

上下文编辑

使用上下文编辑通过自动工具调用清理进行智能上下文管理:
response = client.beta.messages.create(
    betas=["context-management-2025-06-27"],
    model="claude-sonnet-4-5",  # or claude-haiku-4-5
    max_tokens=4096,
    messages=[{"role": "user", "content": "..."}],
    context_management={
        "edits": [
            {
                "type": "clear_tool_uses_20250919",
                "trigger": {"type": "input_tokens", "value": 500},
                "keep": {"type": "tool_uses", "value": 2},
                "clear_at_least": {"type": "input_tokens", "value": 100}
            }
        ]
    },
    tools=[...]
)
此功能在接近令牌限制时自动删除较旧的工具调用和结果,有助于管理长时间运行的代理会话中的上下文。
在 Claude Sonnet 4、Sonnet 4.5、Haiku 4.5、Opus 4 和 Opus 4.1 中可用。需要beta 头context-management-2025-06-27

增强的停止原因

Claude 4.5 模型引入了新的 model_context_window_exceeded 停止原因,明确指示生成因达到上下文窗口限制而停止,而不是请求的 max_tokens 限制。这使得在应用程序逻辑中处理上下文窗口限制变得更容易。
{
  "stop_reason": "model_context_window_exceeded",
  "usage": {
    "input_tokens": 150000,
    "output_tokens": 49950
  }
}

改进的工具参数处理

Claude 4.5 模型包含一个错误修复,保留工具调用字符串参数中的有意格式。以前,字符串参数中的尾随换行符有时会被错误地剥离。此修复确保需要精确格式的工具(如文本编辑器)完全按照预期接收参数。
这是一个幕后改进,不需要 API 更改。但是,具有字符串参数的工具现在可能会接收到以前被剥离的尾随换行符的值。
示例:
// 之前:最终换行符意外被剥离
{
  "type": "tool_use",
  "id": "toolu_01A09q90qw90lq917835lq9",
  "name": "edit_todo",
  "input": {
    "file": "todo.txt",
    "contents": "1. Chop onions.\n2. ???\n3. Profit"
  }
}

// 之后:尾随换行符按预期保留
{
  "type": "tool_use",
  "id": "toolu_01A09q90qw90lq917835lq9",
  "name": "edit_todo",
  "input": {
    "file": "todo.txt",
    "contents": "1. Chop onions.\n2. ???\n3. Profit\n"
  }
}

令牌计数优化

Claude 4.5 模型包含自动优化以改善模型性能。这些优化可能会向请求添加少量令牌,但您不会为这些系统添加的令牌付费

Claude 4 中引入的功能

以下功能在 Claude 4 中引入,并在所有 Claude 4 模型中可用,包括 Claude Sonnet 4.5 和 Claude Haiku 4.5。

新的拒绝停止原因

Claude 4 模型为模型因安全原因拒绝生成的内容引入了新的 refusal 停止原因:
{"id":"msg_014XEDjypDjFzgKVWdFUXxZP",
"type":"message",
"role":"assistant",
"model":"claude-sonnet-4-5",
"content":[{"type":"text","text":"I would be happy to assist you. You can "}],
"stop_reason":"refusal",
"stop_sequence":null,
"usage":{"input_tokens":564,"cache_creation_input_tokens":0,"cache_read_input_tokens":0,"output_tokens":22}
}
使用 Claude 4 模型时,您应该更新应用程序以处理 refusal 停止原因

摘要思维

启用扩展思维后,Claude 4 模型的 Messages API 返回 Claude 完整思维过程的摘要。摘要思维提供扩展思维的全部智能优势,同时防止滥用。 虽然 API 在 Claude 3.7 和 4 模型中是一致的,但扩展思维的流式响应可能以”块状”传递模式返回,流式事件之间可能有延迟。
摘要由与您在请求中目标的模型不同的模型处理。思维模型看不到摘要输出。
有关更多信息,请参阅扩展思维文档

交错思维

Claude 4 模型支持将工具使用与扩展思维交错,允许更自然的对话,其中工具使用和响应可以与常规消息混合。
交错思维处于 beta 阶段。要启用交错思维,请将beta 头 interleaved-thinking-2025-05-14 添加到您的 API 请求中。
有关更多信息,请参阅扩展思维文档

行为差异

Claude 4 模型具有显著的行为变化,可能会影响您构建提示的方式:

沟通风格变化

  • 更简洁直接:Claude 4 模型沟通更高效,解释不那么冗长
  • 更自然的语调:响应稍微更对话化,不那么机械化
  • 注重效率:可能会跳过完成操作后的详细摘要以保持工作流动力(如果需要,您可以提示获得更多详细信息)

指令遵循

Claude 4 模型经过精确指令遵循训练,需要更明确的指导:
  • 明确说明操作:如果您希望 Claude 采取行动,请使用直接语言,如”进行这些更改”或”实现此功能”,而不是”您能建议更改吗”
  • 清楚地说明期望的行为:Claude 会精确遵循指令,因此明确说明您想要的内容有助于获得更好的结果
有关使用这些模型的全面指导,请参阅Claude 4 提示工程最佳实践

更新的文本编辑器工具

文本编辑器工具已为 Claude 4 模型更新,具有以下更改:
  • 工具类型text_editor_20250728
  • 工具名称str_replace_based_edit_tool
  • 不再支持 undo_edit 命令
str_replace_editor 文本编辑器工具对于 Claude Sonnet 3.7 保持不变。
如果您正在从 Claude Sonnet 3.7 迁移并使用文本编辑器工具:
# Claude Sonnet 3.7
tools=[
    {
        "type": "text_editor_20250124",
        "name": "str_replace_editor"
    }
]

# Claude 4 模型
tools=[
    {
        "type": "text_editor_20250728",
        "name": "str_replace_based_edit_tool"
    }
]
有关更多信息,请参阅文本编辑器工具文档

更新的代码执行工具

如果您正在使用代码执行工具,请确保您使用的是最新版本 code_execution_20250825,它添加了 Bash 命令和文件操作功能。 旧版本 code_execution_20250522(仅 Python)仍然可用,但不建议用于新实现。 有关迁移说明,请参阅代码执行工具文档

定价和可用性

定价

Claude 4.5 模型保持竞争性定价:
模型输入输出
Claude Sonnet 4.5每百万令牌 $3每百万令牌 $15
Claude Haiku 4.5每百万令牌 $1每百万令牌 $5
有关更多详细信息,请参阅定价文档

第三方平台定价

从 Claude 4.5 模型(Sonnet 4.5 和 Haiku 4.5)开始,AWS Bedrock 和 Google Vertex AI 提供两种端点类型:
  • 全球端点:动态路由以获得最大可用性
  • 区域端点:保证通过特定地理区域进行数据路由,价格上涨 10%
此区域定价适用于 Claude Sonnet 4.5 和 Claude Haiku 4.5。 Claude API (1P) 默认是全球的,不受此更改影响。 Claude API 仅为全球(相当于其他提供商的全球端点产品和定价)。 有关实现详细信息和迁移指导:

可用性

Claude 4.5 模型可在以下平台使用:
模型Claude APIAmazon BedrockGoogle Cloud Vertex AI
Claude Sonnet 4.5claude-sonnet-4-5-20250929anthropic.claude-sonnet-4-5-20250929-v1:0claude-sonnet-4-5@20250929
Claude Haiku 4.5claude-haiku-4-5-20251001anthropic.claude-haiku-4-5-20251001-v1:0claude-haiku-4-5@20251001
也可通过 Claude.ai 和 Claude Code 平台使用。

迁移指南

重大更改和迁移要求因您要升级的模型而异。有关详细的迁移说明,包括分步指南、重大更改和迁移检查清单,请参阅迁移到 Claude 4.5 迁移指南涵盖以下场景:
  • Claude Sonnet 3.7 → Sonnet 4.5:具有重大更改的完整迁移路径
  • Claude Haiku 3.5 → Haiku 4.5:具有重大更改的完整迁移路径
  • Claude Sonnet 4 → Sonnet 4.5:最少更改的快速升级
  • Claude Opus 4.1 → Sonnet 4.5:无重大更改的无缝升级

下一步