相較於 Sonnet 4 的主要改進
編程卓越性
Claude Sonnet 4.5 是我們迄今為止最佳的編程模型,在整個開發生命週期中都有顯著改進:- SWE-bench Verified 性能:在編程基準測試中達到先進的最新水準
- 增強的規劃和系統設計:更好的架構決策和代碼組織
- 改進的安全工程:更強健的安全實踐和漏洞檢測
- 更好的指令遵循:更精確地遵循編程規範和要求
代理能力
Claude Sonnet 4.5 在代理能力方面引入了重大進展:- 擴展的自主操作:Sonnet 4.5 可以獨立工作數小時,同時保持清晰度並專注於漸進式進展。該模型一次專注於少數任務並穩步推進,而不是試圖同時處理所有事情。它提供基於事實的進度更新,準確反映已完成的工作。
- 上下文感知:Claude 現在在整個對話過程中追蹤其令牌使用情況,在每次工具調用後接收更新。這種感知能力有助於防止過早放棄任務,並在長期運行的任務中實現更有效的執行。請參閱上下文感知了解技術詳情和提示指導。
- 增強的工具使用:該模型更有效地使用並行工具調用,在研究期間同時發起多個推測性搜索,並同時讀取多個文件以更快地建立上下文。跨多個工具和資訊來源的改進協調使模型能夠在代理搜索和編程工作流程中有效利用廣泛的能力。
- 先進的上下文管理:Sonnet 4.5 在外部文件中保持出色的狀態追蹤,跨會話保持目標導向。結合更有效的上下文視窗使用和我們新的上下文管理 API 功能,該模型在擴展會話中最佳地處理資訊,以隨時間保持一致性。
溝通和互動風格
Claude Sonnet 4.5 具有精緻的溝通方式,簡潔、直接且自然。它提供基於事實的進度更新,並可能跳過工具調用後的冗長摘要以保持工作流程動力(儘管這可以通過提示進行調整)。 有關使用此溝通風格的詳細指導,請參閱Claude 4 最佳實踐。創意內容生成
Claude Sonnet 4.5 在創意內容任務方面表現出色:- 簡報和動畫:在創建幻燈片和視覺內容方面達到或超越 Claude Opus 4.1
- 創意天賦:產生精美、專業的輸出,具有強大的指令遵循能力
- 首次嘗試品質:在初次嘗試中生成可用、設計良好的內容
新的 API 功能
記憶工具(Beta)
新的記憶工具使 Claude 能夠在上下文視窗之外儲存和檢索資訊:- 隨時間建立知識庫
- 跨會話維護專案狀態
- 通過基於文件的儲存保持實際上無限的上下文
context-management-2025-06-27
上下文編輯
Claude Sonnet 4.5 引入了上下文編輯,通過自動工具調用清除實現智能上下文管理:增強的停止原因
Claude Sonnet 4.5 引入了新的model_context_window_exceeded
停止原因,明確指示生成因達到上下文視窗限制而停止,而不是請求的 max_tokens
限制。這使得在應用程式邏輯中處理上下文視窗限制變得更容易。
改進的工具參數處理
Claude Sonnet 4.5 包含一個錯誤修復,保留工具調用字串參數中的有意格式。以前,字串參數中的尾隨換行符有時會被錯誤地剝離。此修復確保需要精確格式的工具(如文字編輯器)完全按預期接收參數。這是一個幕後改進,不需要 API 更改。但是,具有字串參數的工具現在可能會接收到以前被剝離的尾隨換行符的值。
令牌計數最佳化
Claude Sonnet 4.5 包含自動最佳化以改善模型性能。這些最佳化可能會在請求中添加少量令牌,但您不會為這些系統添加的令牌付費。定價和可用性
定價
Claude Sonnet 4.5 維持與 Sonnet 4 相同的定價:- 輸入:每百萬令牌 $3
- 輸出:每百萬令牌 $15
可用性
Claude Sonnet 4.5 可在以下平台使用:- Claude API:
claude-sonnet-4-5-20250929
- Amazon Bedrock:
anthropic.claude-sonnet-4-5-20250929-v1:0
- Google Cloud Vertex AI:
claude-sonnet-4-5@20250929
遷移指南
如果您目前使用 Claude Sonnet 4,升級到 Sonnet 4.5 很簡單:- 將您的模型名稱更新為
claude-sonnet-4-5-20250929
- 現有的 API 調用將繼續工作*
- 考慮啟用新功能:
- 用於長期運行代理的記憶工具
- 用於更好上下文管理的工具調用清除
temperature
和 top_p
參數。請只使用其中一個。