模型定價
下表顯示所有 Claude 模型在不同使用層級的定價:| Model | Base Input Tokens | 5m Cache Writes | 1h Cache Writes | Cache Hits & Refreshes | Output Tokens |
|---|---|---|---|---|---|
| Claude Opus 4.1 | $15 / MTok | $18.75 / MTok | $30 / MTok | $1.50 / MTok | $75 / MTok |
| Claude Opus 4 | $15 / MTok | $18.75 / MTok | $30 / MTok | $1.50 / MTok | $75 / MTok |
| Claude Sonnet 4.5 | $3 / MTok | $3.75 / MTok | $6 / MTok | $0.30 / MTok | $15 / MTok |
| Claude Sonnet 4 | $3 / MTok | $3.75 / MTok | $6 / MTok | $0.30 / MTok | $15 / MTok |
| Claude Sonnet 3.7 (deprecated) | $3 / MTok | $3.75 / MTok | $6 / MTok | $0.30 / MTok | $15 / MTok |
| Claude Haiku 4.5 | $1 / MTok | $1.25 / MTok | $2 / MTok | $0.10 / MTok | $5 / MTok |
| Claude Haiku 3.5 | $0.80 / MTok | $1 / MTok | $1.6 / MTok | $0.08 / MTok | $4 / MTok |
| Claude Opus 3 (deprecated) | $15 / MTok | $18.75 / MTok | $30 / MTok | $1.50 / MTok | $75 / MTok |
| Claude Haiku 3 | $0.25 / MTok | $0.30 / MTok | $0.50 / MTok | $0.03 / MTok | $1.25 / MTok |
MTok = 百萬個 token。「基本輸入 Token」欄顯示標準輸入定價,「快取寫入」和「快取命中」專用於提示快取,「輸出 Token」顯示輸出定價。提示快取提供 5 分鐘(預設)和 1 小時快取持續時間,以針對不同使用情境優化成本。上表反映了提示快取的以下定價倍數:
- 5 分鐘快取寫入 token 為基本輸入 token 價格的 1.25 倍
- 1 小時快取寫入 token 為基本輸入 token 價格的 2 倍
- 快取讀取 token 為基本輸入 token 價格的 0.1 倍
第三方平台定價
Claude 模型可在 AWS Bedrock 和 Google Vertex AI 上使用。如需官方定價,請造訪:Claude 4.5 模型及後續版本的區域端點定價從 Claude Sonnet 4.5 和 Haiku 4.5 開始,AWS Bedrock 和 Google Vertex AI 提供兩種端點類型:
- 全球端點:跨區域動態路由以獲得最大可用性
- 區域端點:保證在特定地理區域內進行資料路由
功能特定定價
批次處理
Batch API 允許大量請求的非同步處理,輸入和輸出 token 均享有 50% 折扣。| Model | Batch input | Batch output |
|---|---|---|
| Claude Opus 4.1 | $7.50 / MTok | $37.50 / MTok |
| Claude Opus 4 | $7.50 / MTok | $37.50 / MTok |
| Claude Sonnet 4.5 | $1.50 / MTok | $7.50 / MTok |
| Claude Sonnet 4 | $1.50 / MTok | $7.50 / MTok |
| Claude Sonnet 3.7 (deprecated) | $1.50 / MTok | $7.50 / MTok |
| Claude Haiku 4.5 | $0.50 / MTok | $2.50 / MTok |
| Claude Haiku 3.5 | $0.40 / MTok | $2 / MTok |
| Claude Opus 3 (deprecated) | $7.50 / MTok | $37.50 / MTok |
| Claude Haiku 3 | $0.125 / MTok | $0.625 / MTok |
長上下文定價
當使用 Claude Sonnet 4 或 Sonnet 4.5 並啟用 1M token 上下文視窗時,超過 200K 輸入 token 的請求會自動以優質長上下文費率計費:1M token 上下文視窗目前對使用層級 4 的組織和具有自訂速率限制的組織開放測試版。1M token 上下文視窗僅適用於 Claude Sonnet 4 和 Sonnet 4.5。
| ≤ 200K 輸入 token | > 200K 輸入 token |
|---|---|
| 輸入:$3 / MTok | 輸入:$6 / MTok |
| 輸出:$15 / MTok | 輸出:$22.50 / MTok |
- Batch API 50% 折扣適用於長上下文定價
- 提示快取倍數在長上下文定價基礎上適用
即使啟用了測試版標誌,少於 200K 輸入 token 的請求仍按標準費率計費。如果您的請求超過 200K 輸入 token,所有 token 都會產生優質定價。200K 閾值僅基於輸入 token(包括快取讀取/寫入)。輸出 token 數量不會影響定價層級選擇,但當超過輸入閾值時,輸出 token 會以較高費率計費。
usage 物件:
input_tokenscache_creation_input_tokens(如果使用提示快取)cache_read_input_tokens(如果使用提示快取)
usage 物件的更多資訊,請參閱 API 回應文件。
工具使用定價
Tool use requests are priced based on:- The total number of input tokens sent to the model (including in the
toolsparameter) - The number of output tokens generated
- For server-side tools, additional usage-based pricing (e.g., web search charges per search performed)
- The
toolsparameter in API requests (tool names, descriptions, and schemas) tool_usecontent blocks in API requests and responsestool_resultcontent blocks in API requests
tools, we also automatically include a special system prompt for the model which enables tool use. The number of tool use tokens required for each model are listed below (excluding the additional tokens listed above). Note that the table assumes at least 1 tool is provided. If no tools are provided, then a tool choice of none uses 0 additional system prompt tokens.
| Model | Tool choice | Tool use system prompt token count |
|---|---|---|
| Claude Opus 4.1 | auto, noneany, tool | 346 tokens 313 tokens |
| Claude Opus 4 | auto, noneany, tool | 346 tokens 313 tokens |
| Claude Sonnet 4.5 | auto, noneany, tool | 346 tokens 313 tokens |
| Claude Sonnet 4 | auto, noneany, tool | 346 tokens 313 tokens |
| Claude Sonnet 3.7 (deprecated) | auto, noneany, tool | 346 tokens 313 tokens |
| Claude Haiku 4.5 | auto, noneany, tool | 346 tokens 313 tokens |
| Claude Haiku 3.5 | auto, noneany, tool | 264 tokens 340 tokens |
| Claude Opus 3 (deprecated) | auto, noneany, tool | 530 tokens 281 tokens |
| Claude Sonnet 3 | auto, noneany, tool | 159 tokens 235 tokens |
| Claude Haiku 3 | auto, noneany, tool | 264 tokens 340 tokens |
特定工具定價
Bash 工具
The bash tool adds 245 input tokens to your API calls. Additional tokens are consumed by:- Command outputs (stdout/stderr)
- Error messages
- Large file contents
程式碼執行工具
Code execution tool usage is tracked separately from token usage. Execution time has a minimum of 5 minutes. If files are included in the request, execution time is billed even if the tool is not used due to files being preloaded onto the container. Each organization receives 50 free hours of usage with the code execution tool per day. Additional usage beyond the first 50 hours is billed at $0.05 per hour, per container.文字編輯器工具
The text editor tool uses the same pricing structure as other tools used with Claude. It follows the standard input and output token pricing based on the Claude model you’re using. In addition to the base tokens, the following additional input tokens are needed for the text editor tool:| Tool | Additional input tokens |
|---|---|
text_editor_20250429 (Claude 4.x) | 700 tokens |
text_editor_20250124 (Claude Sonnet 3.7 (deprecated)) | 700 tokens |
網路搜尋工具
Web search usage is charged in addition to token usage:網路擷取工具
Web fetch usage has no additional charges beyond standard token costs:max_content_tokens parameter to set appropriate limits based on your use case and budget considerations.
Example token usage for typical content:
- Average web page (10KB): ~2,500 tokens
- Large documentation page (100KB): ~25,000 tokens
- Research paper PDF (500KB): ~125,000 tokens
電腦使用工具
Computer use follows the standard tool use pricing. When using the computer use tool: System prompt overhead: The computer use beta adds 466-499 tokens to the system prompt Computer use tool token usage:| Model | Input tokens per tool definition |
|---|---|
| Claude 4.x models | 735 tokens |
| Claude Sonnet 3.7 (deprecated) | 735 tokens |
- Screenshot images (see Vision pricing)
- Tool execution results returned to Claude
If you’re also using bash or text editor tools alongside computer use, those tools have their own token costs as documented in their respective pages.
代理使用案例定價範例
在使用 Claude 建構時,了解代理應用程式的定價至關重要。這些真實世界的範例可以幫助您估算不同代理模式的成本。客戶支援代理範例
在建構客戶支援代理時,成本可能如下分解:處理 10,000 張支援票券的範例計算:
- 每次對話平均約 3,700 個 token
- 使用 Claude Sonnet 4.5,輸入 15/MTok
- 總成本:每 10,000 張票券約 $22.20
一般代理工作流程定價
對於具有多個步驟的更複雜代理架構:-
初始請求處理
- 典型輸入:500-1,000 個 token
- 處理成本:每個請求約 $0.003
-
記憶和上下文檢索
- 檢索的上下文:2,000-5,000 個 token
- 每次檢索成本:每次操作約 $0.015
-
行動規劃和執行
- 規劃 token:1,000-2,000
- 執行回饋:500-1,000
- 合併成本:每次行動約 $0.045
成本優化策略
在使用 Claude 建構代理時:- 使用適當的模型:選擇 Haiku 進行簡單任務,Sonnet 進行複雜推理
- 實作提示快取:減少重複上下文的成本
- 批次操作:對非時間敏感任務使用 Batch API
- 監控使用模式:追蹤 token 消耗以識別優化機會
對於高容量代理應用程式,請考慮聯繫我們的企業銷售團隊以獲得自訂定價安排。
其他定價考量
速率限制
速率限制因使用層級而異,並影響您可以發出的請求數量:- 層級 1:具有基本限制的入門級使用
- 層級 2:為成長中的應用程式增加限制
- 層級 3:為已建立的應用程式提供更高限制
- 層級 4:最大標準限制
- 企業:可提供自訂限制
大量折扣
大量使用者可能享有大量折扣。這些是根據個案進行協商的。- 標準層級使用上述顯示的定價
- 企業客戶可以聯繫銷售以獲得自訂定價
- 可能提供學術和研究折扣
企業定價
對於有特定需求的企業客戶:- 自訂速率限制
- 大量折扣
- 專屬支援
- 自訂條款
帳單和付款
- 帳單根據實際使用量按月計算
- 付款以美元處理
- 提供信用卡和發票選項
- 使用追蹤可在 Claude Console 中查看