Harga model
Tabel berikut menunjukkan harga untuk semua model Claude di berbagai tingkat penggunaan:| Model | Base Input Tokens | 5m Cache Writes | 1h Cache Writes | Cache Hits & Refreshes | Output Tokens |
|---|---|---|---|---|---|
| Claude Opus 4.1 | $15 / MTok | $18.75 / MTok | $30 / MTok | $1.50 / MTok | $75 / MTok |
| Claude Opus 4 | $15 / MTok | $18.75 / MTok | $30 / MTok | $1.50 / MTok | $75 / MTok |
| Claude Sonnet 4.5 | $3 / MTok | $3.75 / MTok | $6 / MTok | $0.30 / MTok | $15 / MTok |
| Claude Sonnet 4 | $3 / MTok | $3.75 / MTok | $6 / MTok | $0.30 / MTok | $15 / MTok |
| Claude Sonnet 3.7 (deprecated) | $3 / MTok | $3.75 / MTok | $6 / MTok | $0.30 / MTok | $15 / MTok |
| Claude Haiku 4.5 | $1 / MTok | $1.25 / MTok | $2 / MTok | $0.10 / MTok | $5 / MTok |
| Claude Haiku 3.5 | $0.80 / MTok | $1 / MTok | $1.6 / MTok | $0.08 / MTok | $4 / MTok |
| Claude Opus 3 (deprecated) | $15 / MTok | $18.75 / MTok | $30 / MTok | $1.50 / MTok | $75 / MTok |
| Claude Haiku 3 | $0.25 / MTok | $0.30 / MTok | $0.50 / MTok | $0.03 / MTok | $1.25 / MTok |
MTok = Juta token. Kolom “Base Input Tokens” menunjukkan harga input standar, “Cache Writes” dan “Cache Hits” khusus untuk prompt caching, dan “Output Tokens” menunjukkan harga output. Prompt caching menawarkan durasi cache 5 menit (default) dan 1 jam untuk mengoptimalkan biaya untuk berbagai kasus penggunaan.Tabel di atas mencerminkan pengali harga berikut untuk prompt caching:
- Token tulis cache 5 menit adalah 1,25 kali harga token input dasar
- Token tulis cache 1 jam adalah 2 kali harga token input dasar
- Token baca cache adalah 0,1 kali harga token input dasar
Harga platform pihak ketiga
Model Claude tersedia di AWS Bedrock dan Google Vertex AI. Untuk harga resmi, kunjungi:Harga endpoint regional untuk model Claude 4.5 dan seterusnyaDimulai dengan Claude Sonnet 4.5 dan Haiku 4.5, AWS Bedrock dan Google Vertex AI menawarkan dua jenis endpoint:
- Endpoint global: Routing dinamis lintas wilayah untuk ketersediaan maksimum
- Endpoint regional: Routing data dijamin dalam wilayah geografis tertentu
Harga khusus fitur
Pemrosesan batch
Batch API memungkinkan pemrosesan asinkron dari volume besar permintaan dengan diskon 50% pada token input dan output.| Model | Batch input | Batch output |
|---|---|---|
| Claude Opus 4.1 | $7.50 / MTok | $37.50 / MTok |
| Claude Opus 4 | $7.50 / MTok | $37.50 / MTok |
| Claude Sonnet 4.5 | $1.50 / MTok | $7.50 / MTok |
| Claude Sonnet 4 | $1.50 / MTok | $7.50 / MTok |
| Claude Sonnet 3.7 (deprecated) | $1.50 / MTok | $7.50 / MTok |
| Claude Haiku 4.5 | $0.50 / MTok | $2.50 / MTok |
| Claude Haiku 3.5 | $0.40 / MTok | $2 / MTok |
| Claude Opus 3 (deprecated) | $7.50 / MTok | $37.50 / MTok |
| Claude Haiku 3 | $0.125 / MTok | $0.625 / MTok |
Harga konteks panjang
Saat menggunakan Claude Sonnet 4 atau Sonnet 4.5 dengan jendela konteks 1M token diaktifkan, permintaan yang melebihi 200K token input secara otomatis dikenakan tarif konteks panjang premium:Jendela konteks 1M token saat ini dalam beta untuk organisasi di tingkat penggunaan 4 dan organisasi dengan batas tarif kustom. Jendela konteks 1M token hanya tersedia untuk Claude Sonnet 4 dan Sonnet 4.5.
| ≤ 200K token input | > 200K token input |
|---|---|
| Input: $3 / MTok | Input: $6 / MTok |
| Output: $15 / MTok | Output: $22.50 / MTok |
- Diskon 50% Batch API berlaku untuk harga konteks panjang
- Pengali prompt caching berlaku di atas harga konteks panjang
Bahkan dengan flag beta diaktifkan, permintaan dengan kurang dari 200K token input dikenakan tarif standar. Jika permintaan Anda melebihi 200K token input, semua token dikenakan harga premium.Ambang batas 200K hanya berdasarkan token input (termasuk baca/tulis cache). Jumlah token output tidak mempengaruhi pemilihan tingkat harga, meskipun token output dikenakan tarif yang lebih tinggi ketika ambang batas input terlampaui.
usage dalam respons API:
input_tokenscache_creation_input_tokens(jika menggunakan prompt caching)cache_read_input_tokens(jika menggunakan prompt caching)
usage, lihat dokumentasi respons API.
Harga penggunaan tool
Tool use requests are priced based on:- The total number of input tokens sent to the model (including in the
toolsparameter) - The number of output tokens generated
- For server-side tools, additional usage-based pricing (e.g., web search charges per search performed)
- The
toolsparameter in API requests (tool names, descriptions, and schemas) tool_usecontent blocks in API requests and responsestool_resultcontent blocks in API requests
tools, we also automatically include a special system prompt for the model which enables tool use. The number of tool use tokens required for each model are listed below (excluding the additional tokens listed above). Note that the table assumes at least 1 tool is provided. If no tools are provided, then a tool choice of none uses 0 additional system prompt tokens.
| Model | Tool choice | Tool use system prompt token count |
|---|---|---|
| Claude Opus 4.1 | auto, noneany, tool | 346 tokens 313 tokens |
| Claude Opus 4 | auto, noneany, tool | 346 tokens 313 tokens |
| Claude Sonnet 4.5 | auto, noneany, tool | 346 tokens 313 tokens |
| Claude Sonnet 4 | auto, noneany, tool | 346 tokens 313 tokens |
| Claude Sonnet 3.7 (deprecated) | auto, noneany, tool | 346 tokens 313 tokens |
| Claude Haiku 4.5 | auto, noneany, tool | 346 tokens 313 tokens |
| Claude Haiku 3.5 | auto, noneany, tool | 264 tokens 340 tokens |
| Claude Opus 3 (deprecated) | auto, noneany, tool | 530 tokens 281 tokens |
| Claude Sonnet 3 | auto, noneany, tool | 159 tokens 235 tokens |
| Claude Haiku 3 | auto, noneany, tool | 264 tokens 340 tokens |
Harga tool spesifik
Tool Bash
The bash tool adds 245 input tokens to your API calls. Additional tokens are consumed by:- Command outputs (stdout/stderr)
- Error messages
- Large file contents
Tool eksekusi kode
Code execution tool usage is tracked separately from token usage. Execution time has a minimum of 5 minutes. If files are included in the request, execution time is billed even if the tool is not used due to files being preloaded onto the container. Each organization receives 50 free hours of usage with the code execution tool per day. Additional usage beyond the first 50 hours is billed at $0.05 per hour, per container.Tool editor teks
The text editor tool uses the same pricing structure as other tools used with Claude. It follows the standard input and output token pricing based on the Claude model you’re using. In addition to the base tokens, the following additional input tokens are needed for the text editor tool:| Tool | Additional input tokens |
|---|---|
text_editor_20250429 (Claude 4.x) | 700 tokens |
text_editor_20250124 (Claude Sonnet 3.7 (deprecated)) | 700 tokens |
Tool pencarian web
Web search usage is charged in addition to token usage:Tool pengambilan web
Web fetch usage has no additional charges beyond standard token costs:max_content_tokens parameter to set appropriate limits based on your use case and budget considerations.
Example token usage for typical content:
- Average web page (10KB): ~2,500 tokens
- Large documentation page (100KB): ~25,000 tokens
- Research paper PDF (500KB): ~125,000 tokens
Tool penggunaan komputer
Computer use follows the standard tool use pricing. When using the computer use tool: System prompt overhead: The computer use beta adds 466-499 tokens to the system prompt Computer use tool token usage:| Model | Input tokens per tool definition |
|---|---|
| Claude 4.x models | 735 tokens |
| Claude Sonnet 3.7 (deprecated) | 735 tokens |
- Screenshot images (see Vision pricing)
- Tool execution results returned to Claude
If you’re also using bash or text editor tools alongside computer use, those tools have their own token costs as documented in their respective pages.
Contoh harga kasus penggunaan agen
Memahami harga untuk aplikasi agen sangat penting saat membangun dengan Claude. Contoh dunia nyata ini dapat membantu Anda memperkirakan biaya untuk pola agen yang berbeda.Contoh agen dukungan pelanggan
Saat membangun agen dukungan pelanggan, berikut cara biaya dapat dipecah:Contoh perhitungan untuk memproses 10.000 tiket dukungan:
- Rata-rata ~3.700 token per percakapan
- Menggunakan Claude Sonnet 4.5 pada 15/MTok output
- Total biaya: ~$22.20 per 10.000 tiket
Harga alur kerja agen umum
Untuk arsitektur agen yang lebih kompleks dengan beberapa langkah:-
Pemrosesan permintaan awal
- Input tipikal: 500-1.000 token
- Biaya pemrosesan: ~$0.003 per permintaan
-
Pengambilan memori dan konteks
- Konteks yang diambil: 2.000-5.000 token
- Biaya per pengambilan: ~$0.015 per operasi
-
Perencanaan dan eksekusi tindakan
- Token perencanaan: 1.000-2.000
- Umpan balik eksekusi: 500-1.000
- Biaya gabungan: ~$0.045 per tindakan
Strategi optimasi biaya
Saat membangun agen dengan Claude:- Gunakan model yang sesuai: Pilih Haiku untuk tugas sederhana, Sonnet untuk penalaran kompleks
- Implementasikan prompt caching: Kurangi biaya untuk konteks berulang
- Operasi batch: Gunakan Batch API untuk tugas yang tidak sensitif waktu
- Pantau pola penggunaan: Lacak konsumsi token untuk mengidentifikasi peluang optimasi
Untuk aplikasi agen volume tinggi, pertimbangkan untuk menghubungi tim penjualan enterprise kami untuk pengaturan harga kustom.
Pertimbangan harga tambahan
Batas tarif
Batas tarif bervariasi berdasarkan tingkat penggunaan dan mempengaruhi berapa banyak permintaan yang dapat Anda buat:- Tingkat 1: Penggunaan tingkat pemula dengan batas dasar
- Tingkat 2: Batas yang ditingkatkan untuk aplikasi yang berkembang
- Tingkat 3: Batas yang lebih tinggi untuk aplikasi yang mapan
- Tingkat 4: Batas standar maksimum
- Enterprise: Batas kustom tersedia
Diskon volume
Diskon volume mungkin tersedia untuk pengguna volume tinggi. Ini dinegosiasikan berdasarkan kasus per kasus.- Tingkat standar menggunakan harga yang ditunjukkan di atas
- Pelanggan enterprise dapat menghubungi penjualan untuk harga kustom
- Diskon akademik dan penelitian mungkin tersedia
Harga enterprise
Untuk pelanggan enterprise dengan kebutuhan khusus:- Batas tarif kustom
- Diskon volume
- Dukungan khusus
- Syarat kustom
Penagihan dan pembayaran
- Penagihan dihitung bulanan berdasarkan penggunaan aktual
- Pembayaran diproses dalam USD
- Opsi kartu kredit dan faktur tersedia
- Pelacakan penggunaan tersedia di Claude Console