相較於 Sonnet 4 的主要改進

編碼卓越性

Claude Sonnet 4.5 是我們迄今為止最佳的編碼模型,在整個開發生命週期中都有顯著改進:
  • SWE-bench Verified 性能:在編碼基準測試中達到先進的最新水準
  • 增強的規劃和系統設計:更好的架構決策和程式碼組織
  • 改進的安全工程:更強健的安全實踐和漏洞檢測
  • 更好的指令遵循:更精確地遵循編碼規範和要求
延伸思考以獲得最佳性能:當啟用延伸思考時,Claude Sonnet 4.5 在編碼任務上的表現顯著更好。延伸思考預設為停用,但我們建議在複雜的編碼工作中啟用它。請注意,延伸思考會影響提示快取效率。請參閱遷移指南以獲取配置詳細資訊。

代理能力

Claude Sonnet 4.5 在代理能力方面引入了重大進展:
  • 延長的自主操作:Sonnet 4.5 可以獨立工作數小時,同時保持清晰度並專注於漸進式進展。該模型一次在少數任務上取得穩定進展,而不是試圖同時處理所有事情。它提供基於事實的進度更新,準確反映已完成的工作。
  • 上下文感知:Claude 現在在整個對話過程中追蹤其令牌使用情況,在每次工具呼叫後接收更新。這種感知有助於防止過早放棄任務,並在長時間運行的任務中實現更有效的執行。請參閱上下文感知以獲取技術詳細資訊和提示指導
  • 增強的工具使用:該模型更有效地使用並行工具呼叫,在研究期間同時發起多個推測性搜尋,並同時讀取多個檔案以更快地建立上下文。跨多個工具和資訊來源的改進協調使模型能夠在代理搜尋和編碼工作流程中有效利用廣泛的能力。
  • 先進的上下文管理:Sonnet 4.5 在外部檔案中保持出色的狀態追蹤,跨會話保持目標導向。結合更有效的上下文視窗使用和我們新的上下文管理 API 功能,該模型最佳地處理跨延長會話的資訊,以隨時間保持一致性。

溝通和互動風格

Claude Sonnet 4.5 具有精緻的溝通方式,簡潔、直接且自然。它提供基於事實的進度更新,並可能在工具呼叫後跳過冗長的摘要以保持工作流程動力(儘管這可以透過提示進行調整)。 有關使用此溝通風格的詳細指導,請參閱 Claude 4 最佳實踐

創意內容生成

Claude Sonnet 4.5 在創意內容任務中表現出色:
  • 簡報和動畫:在建立幻燈片和視覺內容方面達到或超越 Claude Opus 4.1
  • 創意天賦:產生精緻、專業的輸出,具有強大的指令遵循能力
  • 首次嘗試品質:在初次嘗試中生成可用、設計良好的內容

新的 API 功能

記憶工具(測試版)

新的記憶工具使 Claude 能夠在上下文視窗之外儲存和檢索資訊:
tools=[
    {
        "type": "memory_20250818",
        "name": "memory"
    }
]
這允許:
  • 隨時間建立知識庫
  • 跨會話維護專案狀態
  • 透過基於檔案的儲存保持實際上無限的上下文
需要測試版標頭context-management-2025-06-27

上下文編輯

Claude Sonnet 4.5 引入了上下文編輯,透過自動工具呼叫清除進行智慧上下文管理:
response = client.beta.messages.create(
    betas=["context-management-2025-06-27"],
    model="claude-sonnet-4-5",
    max_tokens=4096,
    messages=[{"role": "user", "content": "..."}],
    context_management={
        "edits": [
            {
                "type": "clear_tool_uses_20250919",
                "trigger": {"type": "input_tokens", "value": 500},
                "keep": {"type": "tool_uses", "value": 2},
                "clear_at_least": {"type": "input_tokens", "value": 100}
            }
        ]
    },
    tools=[...]
)
此功能在接近令牌限制時自動移除較舊的工具呼叫和結果,有助於在長時間運行的代理會話中管理上下文。

增強的停止原因

Claude Sonnet 4.5 引入了新的 model_context_window_exceeded 停止原因,明確指示生成因達到上下文視窗限制而停止,而不是請求的 max_tokens 限制。這使得在應用程式邏輯中處理上下文視窗限制變得更容易。
{
  "stop_reason": "model_context_window_exceeded",
  "usage": {
    "input_tokens": 150000,
    "output_tokens": 49950
  }
}

改進的工具參數處理

Claude Sonnet 4.5 包含一個錯誤修復,保留工具呼叫字串參數中的故意格式。以前,字串參數中的尾隨換行符有時會被錯誤地剝離。此修復確保需要精確格式的工具(如文字編輯器)完全按預期接收參數。
這是一個幕後改進,不需要 API 更改。但是,具有字串參數的工具現在可能會接收到以前被剝離的尾隨換行符的值。
範例:
// 之前:最終換行符意外被剝離
{
  "type": "tool_use",
  "id": "toolu_01A09q90qw90lq917835lq9",
  "name": "edit_todo",
  "input": {
    "file": "todo.txt",
    "contents": "1. Chop onions.\n2. ???\n3. Profit"
  }
}

// 之後:尾隨換行符按預期保留
{
  "type": "tool_use",
  "id": "toolu_01A09q90qw90lq917835lq9",
  "name": "edit_todo",
  "input": {
    "file": "todo.txt",
    "contents": "1. Chop onions.\n2. ???\n3. Profit\n"
  }
}

令牌計數最佳化

Claude Sonnet 4.5 包含自動最佳化以改善模型性能。這些最佳化可能會為請求添加少量令牌,但您不會為這些系統添加的令牌付費

定價和可用性

定價

Claude Sonnet 4.5 維持與 Sonnet 4 相同的定價:
  • 輸入:每百萬令牌 3 美元
  • 輸出:每百萬令牌 15 美元

第三方平台定價

從 Claude Sonnet 4.5 開始,我們為 AWS Bedrock 和 Google Vertex AI 引入了全球端點定價。這些平台現在提供兩種端點類型:
  • 全球端點:動態路由以獲得最大可用性,無定價溢價
  • 區域端點:保證透過特定地理區域進行資料路由,10% 定價溢價
Claude API (1P) 預設為全球性且不受此變更影響 - 直接使用 Claude API 時沒有區域定價差異。 有關實施詳細資訊和遷移指導:

可用性

Claude Sonnet 4.5 可在以下平台使用:
  • Claude APIclaude-sonnet-4-5-20250929
  • Amazon Bedrockanthropic.claude-sonnet-4-5-20250929-v1:0
  • Google Cloud Vertex AIclaude-sonnet-4-5@20250929
也可透過 Claude.ai 和 Claude Code 平台使用。

遷移指南

如果您目前使用 Claude Sonnet 4,升級到 Sonnet 4.5 很簡單:
  1. 將您的模型名稱更新為 claude-sonnet-4-5-20250929
  2. 現有的 API 呼叫將繼續工作*
  3. 考慮啟用新功能:
    • 用於長時間運行代理的記憶工具
    • 用於更好上下文管理的工具呼叫清除
如果從 Claude 3 模型遷移到 Sonnet 4.5,請參閱遷移到 Claude 4 以獲取詳細的遷移說明。 * - Sonnet 4.5 不允許同時指定 temperaturetop_p 參數。請僅使用其中一個。

下一步