Kelola biaya secara efektif
Pelajari cara melacak dan mengoptimalkan penggunaan token dan biaya saat menggunakan Claude Code.
Claude Code mengonsumsi token untuk setiap interaksi. Biaya rata-rata adalah 12 untuk 90% pengguna.
Untuk penggunaan tim, Claude Code mengenakan biaya berdasarkan konsumsi token API. Rata-rata, Claude Code berharga ~$100-200/pengembang per bulan dengan Sonnet 4 meskipun ada variasi besar tergantung pada berapa banyak instance yang dijalankan pengguna dan apakah mereka menggunakannya dalam otomatisasi.
Lacak biaya Anda
Menggunakan perintah /cost
Perintah /cost
tidak dimaksudkan untuk pelanggan Claude Max dan Pro.
Perintah /cost
menyediakan statistik penggunaan token yang terperinci untuk sesi Anda saat ini:
Opsi pelacakan tambahan
Periksa penggunaan historis di Anthropic Console (memerlukan peran Admin atau Billing) dan tetapkan batas pengeluaran workspace untuk workspace Claude Code (memerlukan peran Admin).
Ketika Anda pertama kali mengautentikasi Claude Code dengan akun Anthropic Console Anda, workspace yang disebut “Claude Code” secara otomatis dibuat untuk Anda. Workspace ini menyediakan pelacakan dan manajemen biaya terpusat untuk semua penggunaan Claude Code di organisasi Anda.
Mengelola biaya untuk tim
Saat menggunakan Anthropic API, Anda dapat membatasi total pengeluaran workspace Claude Code. Untuk mengkonfigurasi, ikuti instruksi ini. Admin dapat melihat laporan biaya dan penggunaan dengan mengikuti instruksi ini.
Di Bedrock dan Vertex, Claude Code tidak mengirim metrik dari cloud Anda. Untuk mendapatkan metrik biaya, beberapa perusahaan besar melaporkan menggunakan LiteLLM, yang merupakan alat open-source yang membantu perusahaan melacak pengeluaran berdasarkan kunci. Proyek ini tidak berafiliasi dengan Anthropic dan kami belum mengaudit keamanannya.
Rekomendasi batas laju
Saat menyiapkan Claude Code untuk tim, pertimbangkan rekomendasi Token Per Menit (TPM) dan Request Per Menit (RPM) per pengguna ini berdasarkan ukuran organisasi Anda:
Ukuran tim | TPM per pengguna | RPM per pengguna |
---|---|---|
1-5 pengguna | 200k-300k | 5-7 |
5-20 pengguna | 100k-150k | 2.5-3.5 |
20-50 pengguna | 50k-75k | 1.25-1.75 |
50-100 pengguna | 25k-35k | 0.62-0.87 |
100-500 pengguna | 15k-20k | 0.37-0.47 |
500+ pengguna | 10k-15k | 0.25-0.35 |
Sebagai contoh, jika Anda memiliki 200 pengguna, Anda mungkin meminta 20k TPM untuk setiap pengguna, atau 4 juta total TPM (200*20,000 = 4 juta).
TPM per pengguna menurun seiring bertambahnya ukuran tim karena kami mengharapkan lebih sedikit pengguna yang menggunakan Claude Code secara bersamaan di organisasi yang lebih besar. Batas laju ini berlaku di tingkat organisasi, bukan per pengguna individual, yang berarti pengguna individual dapat sementara mengonsumsi lebih dari bagian yang dihitung mereka ketika yang lain tidak aktif menggunakan layanan.
Jika Anda mengantisipasi skenario dengan penggunaan bersamaan yang sangat tinggi (seperti sesi pelatihan langsung dengan kelompok besar), Anda mungkin memerlukan alokasi TPM yang lebih tinggi per pengguna.
Kurangi penggunaan token
-
Percakapan kompak:
-
Claude menggunakan auto-compact secara default ketika konteks melebihi kapasitas 95%
-
Beralih auto-compact: Jalankan
/config
dan navigasi ke “Auto-compact enabled” -
Gunakan
/compact
secara manual ketika konteks menjadi besar -
Tambahkan instruksi kustom:
/compact Focus on code samples and API usage
-
Sesuaikan kompaksi dengan menambahkan ke CLAUDE.md:
-
-
Tulis kueri spesifik: Hindari permintaan yang samar yang memicu pemindaian yang tidak perlu
-
Bagi tugas kompleks: Bagi tugas besar menjadi interaksi yang terfokus
-
Bersihkan riwayat antar tugas: Gunakan
/clear
untuk mereset konteks
Biaya dapat bervariasi secara signifikan berdasarkan:
- Ukuran codebase yang dianalisis
- Kompleksitas kueri
- Jumlah file yang dicari atau dimodifikasi
- Panjang riwayat percakapan
- Frekuensi kompaksi percakapan
- Proses latar belakang (generasi haiku, ringkasan percakapan)
Penggunaan token latar belakang
Claude Code menggunakan token untuk beberapa fungsionalitas latar belakang bahkan saat idle:
- Generasi haiku: Pesan kreatif kecil yang muncul saat Anda mengetik (sekitar 1 sen per hari)
- Ringkasan percakapan: Pekerjaan latar belakang yang meringkas percakapan sebelumnya untuk fitur
claude --resume
- Pemrosesan perintah: Beberapa perintah seperti
/cost
mungkin menghasilkan permintaan untuk memeriksa status
Proses latar belakang ini mengonsumsi sejumlah kecil token (biasanya di bawah $0.04 per sesi) bahkan tanpa interaksi aktif.
Melacak perubahan versi dan pembaruan
Informasi versi saat ini
Untuk memeriksa versi Claude Code Anda saat ini dan detail instalasi:
Perintah ini menunjukkan versi Anda, jenis instalasi, dan informasi sistem.
Memahami perubahan dalam perilaku Claude Code
Claude Code secara teratur menerima pembaruan yang dapat mengubah cara kerja fitur, termasuk laporan biaya:
- Pelacakan versi: Gunakan
claude doctor
untuk melihat versi Anda saat ini - Perubahan perilaku: Fitur seperti
/cost
mungkin menampilkan informasi secara berbeda di berbagai versi - Akses dokumentasi: Claude selalu memiliki akses ke dokumentasi terbaru, yang dapat membantu menjelaskan perilaku fitur saat ini
Ketika laporan biaya berubah
Jika Anda melihat perubahan dalam cara biaya ditampilkan (seperti perintah /cost
menunjukkan informasi yang berbeda):
- Verifikasi versi Anda: Jalankan
claude doctor
untuk mengonfirmasi versi Anda saat ini - Konsultasi dokumentasi: Tanyakan Claude langsung tentang perilaku fitur saat ini, karena ia memiliki akses ke dokumentasi yang terbaru
- Hubungi dukungan: Untuk pertanyaan penagihan spesifik, hubungi dukungan Anthropic melalui akun Console Anda
Untuk deployment tim, kami merekomendasikan memulai dengan kelompok pilot kecil untuk menetapkan pola penggunaan sebelum rollout yang lebih luas.