開始之前
本指南假設您已經決定使用延伸思考模式,並已經查看了我們關於如何開始使用延伸思考的基本步驟,以及我們的延伸思考實作指南。延伸思考的技術考量
- 思考代幣的最小預算為 1024 個代幣。我們建議您從最小思考預算開始,然後根據您的需求和任務複雜度逐步增加調整。
- 對於最佳思考預算超過 32K 的工作負載,我們建議您使用批次處理以避免網路問題。推動模型思考超過 32K 代幣的請求會導致長時間運行的請求,可能會遇到系統超時和開放連接限制。
- 延伸思考在英語中表現最佳,儘管最終輸出可以是Claude 支援的任何語言。
- 如果您需要低於最小預算的思考,我們建議使用標準模式,關閉思考功能,並使用傳統的思維鏈提示與 XML 標籤(如
<thinking>)。請參閱思維鏈提示。
延伸思考的提示技巧
先使用一般指令,然後用更詳細的逐步指令進行故障排除
Claude 通常在高層次指令下表現更好,只需深入思考任務,而不是逐步的規範性指導。模型在解決問題方面的創造力可能超過人類規定最佳思考過程的能力。 例如,不要這樣:延伸思考的多次提示
多次提示與延伸思考配合良好。當您為 Claude 提供如何思考問題的範例時,它會在其延伸思考區塊中遵循類似的推理模式。 您可以在延伸思考場景中通過使用 XML 標籤(如<thinking> 或 <scratchpad>)來指示這些範例中延伸思考的典型模式,在您的提示中包含少量範例。
Claude 會將模式推廣到正式的延伸思考過程。然而,給 Claude 自由思考的空間,讓它以認為最佳的方式思考,可能會獲得更好的結果。
範例:
使用延伸思考最大化指令遵循
當啟用延伸思考時,Claude 顯示出顯著改善的指令遵循能力。模型通常:- 在延伸思考區塊內對指令進行推理
- 在回應中執行這些指令
- 對您想要的內容要清晰和具體
- 對於複雜的指令,考慮將它們分解為 Claude 應該有條不紊地執行的編號步驟
- 允許 Claude 有足夠的預算在其延伸思考中充分處理指令
使用延伸思考來調試和引導 Claude 的行為
您可以使用 Claude 的思考輸出來調試 Claude 的邏輯,儘管這種方法並不總是完全可靠。 為了最好地利用這種方法,我們建議以下技巧:- 我們不建議將 Claude 的延伸思考傳回用戶文本區塊中,因為這不會改善性能,實際上可能會降低結果。
- 明確不允許預填延伸思考,手動更改模型在其思考區塊之後的輸出文本可能會由於模型混亂而降低結果。
assistant 回應文本預填仍然是允許的。
有時 Claude 可能會在助手輸出文本中重複其延伸思考。如果您想要乾淨的回應,請指示 Claude 不要重複其延伸思考,只輸出答案。
充分利用長輸出和長篇思考
對於資料集生成用例,嘗試諸如「請創建一個極其詳細的…表格」之類的提示來生成綜合資料集。 對於詳細內容生成等用例,您可能希望生成更長的延伸思考區塊和更詳細的回應,請嘗試這些技巧:- 增加最大延伸思考長度並明確要求更長的輸出
- 對於非常長的輸出(20,000+ 字),請求一個詳細的大綱,包含到段落級別的字數統計。然後要求 Claude 將其段落索引到大綱並保持指定的字數
我們不建議您為了輸出代幣而推動 Claude 輸出更多代幣。相反,我們鼓勵您從小的思考預算開始,根據需要增加以找到您用例的最佳設置。
複雜的 STEM 問題
複雜的 STEM 問題
複雜的 STEM 問題需要 Claude 建立心理模型、應用專業知識並通過順序邏輯步驟工作——這些過程受益於更長的推理時間。
約束優化問題
約束優化問題
約束優化挑戰 Claude 同時滿足多個競爭需求,當允許長延伸思考時間時最能完成,這樣模型可以有條不紊地處理每個約束。
思考框架
思考框架
結構化思考框架為 Claude 提供了明確的方法論,當 Claude 有長延伸思考空間來遵循每個步驟時可能效果最佳。
讓 Claude 反思並檢查其工作以改善一致性和錯誤處理
您可以使用簡單的自然語言提示來改善一致性並減少錯誤:- 要求 Claude 在宣布任務完成之前用簡單的測試驗證其工作
- 指示模型分析其前一步是否達到了預期結果
- 對於編碼任務,要求 Claude 在其延伸思考中運行測試案例