Claude Code mengonsumsi token untuk setiap interaksi. Biaya rata-rata adalah 6perpengembangperhari,denganbiayahariantetapdibawah6 per pengembang per hari, dengan biaya harian tetap di bawah 12 untuk 90% pengguna.

Untuk penggunaan tim, Claude Code mengenakan biaya berdasarkan konsumsi token API. Rata-rata, Claude Code berharga ~$100-200/pengembang per bulan dengan Sonnet 4 meskipun ada variasi besar tergantung pada berapa banyak instance yang dijalankan pengguna dan apakah mereka menggunakannya dalam otomatisasi.

Lacak biaya Anda

Menggunakan perintah /cost

Perintah /cost tidak dimaksudkan untuk pelanggan Claude Max dan Pro.

Perintah /cost menyediakan statistik penggunaan token yang terperinci untuk sesi Anda saat ini:

Total cost:            $0.55
Total duration (API):  6m 19.7s
Total duration (wall): 6h 33m 10.2s
Total code changes:    0 lines added, 0 lines removed

Opsi pelacakan tambahan

Periksa penggunaan historis di Anthropic Console (memerlukan peran Admin atau Billing) dan tetapkan batas pengeluaran workspace untuk workspace Claude Code (memerlukan peran Admin).

Ketika Anda pertama kali mengautentikasi Claude Code dengan akun Anthropic Console Anda, workspace yang disebut “Claude Code” secara otomatis dibuat untuk Anda. Workspace ini menyediakan pelacakan dan manajemen biaya terpusat untuk semua penggunaan Claude Code di organisasi Anda.

Mengelola biaya untuk tim

Saat menggunakan Anthropic API, Anda dapat membatasi total pengeluaran workspace Claude Code. Untuk mengkonfigurasi, ikuti instruksi ini. Admin dapat melihat laporan biaya dan penggunaan dengan mengikuti instruksi ini.

Di Bedrock dan Vertex, Claude Code tidak mengirim metrik dari cloud Anda. Untuk mendapatkan metrik biaya, beberapa perusahaan besar melaporkan menggunakan LiteLLM, yang merupakan alat open-source yang membantu perusahaan melacak pengeluaran berdasarkan kunci. Proyek ini tidak berafiliasi dengan Anthropic dan kami belum mengaudit keamanannya.

Rekomendasi batas laju

Saat menyiapkan Claude Code untuk tim, pertimbangkan rekomendasi Token Per Menit (TPM) dan Request Per Menit (RPM) per pengguna ini berdasarkan ukuran organisasi Anda:

Ukuran timTPM per penggunaRPM per pengguna
1-5 pengguna200k-300k5-7
5-20 pengguna100k-150k2.5-3.5
20-50 pengguna50k-75k1.25-1.75
50-100 pengguna25k-35k0.62-0.87
100-500 pengguna15k-20k0.37-0.47
500+ pengguna10k-15k0.25-0.35

Sebagai contoh, jika Anda memiliki 200 pengguna, Anda mungkin meminta 20k TPM untuk setiap pengguna, atau 4 juta total TPM (200*20,000 = 4 juta).

TPM per pengguna menurun seiring bertambahnya ukuran tim karena kami mengharapkan lebih sedikit pengguna yang menggunakan Claude Code secara bersamaan di organisasi yang lebih besar. Batas laju ini berlaku di tingkat organisasi, bukan per pengguna individual, yang berarti pengguna individual dapat sementara mengonsumsi lebih dari bagian yang dihitung mereka ketika yang lain tidak aktif menggunakan layanan.

Jika Anda mengantisipasi skenario dengan penggunaan bersamaan yang sangat tinggi (seperti sesi pelatihan langsung dengan kelompok besar), Anda mungkin memerlukan alokasi TPM yang lebih tinggi per pengguna.

Kurangi penggunaan token

  • Percakapan kompak:

    • Claude menggunakan auto-compact secara default ketika konteks melebihi kapasitas 95%

    • Beralih auto-compact: Jalankan /config dan navigasi ke “Auto-compact enabled”

    • Gunakan /compact secara manual ketika konteks menjadi besar

    • Tambahkan instruksi kustom: /compact Focus on code samples and API usage

    • Sesuaikan kompaksi dengan menambahkan ke CLAUDE.md:

      # Summary instructions
      
      When you are using compact, please focus on test output and code changes
      
  • Tulis kueri spesifik: Hindari permintaan yang samar yang memicu pemindaian yang tidak perlu

  • Bagi tugas kompleks: Bagi tugas besar menjadi interaksi yang terfokus

  • Bersihkan riwayat antar tugas: Gunakan /clear untuk mereset konteks

Biaya dapat bervariasi secara signifikan berdasarkan:

  • Ukuran codebase yang dianalisis
  • Kompleksitas kueri
  • Jumlah file yang dicari atau dimodifikasi
  • Panjang riwayat percakapan
  • Frekuensi kompaksi percakapan
  • Proses latar belakang (generasi haiku, ringkasan percakapan)

Penggunaan token latar belakang

Claude Code menggunakan token untuk beberapa fungsionalitas latar belakang bahkan saat idle:

  • Generasi haiku: Pesan kreatif kecil yang muncul saat Anda mengetik (sekitar 1 sen per hari)
  • Ringkasan percakapan: Pekerjaan latar belakang yang meringkas percakapan sebelumnya untuk fitur claude --resume
  • Pemrosesan perintah: Beberapa perintah seperti /cost mungkin menghasilkan permintaan untuk memeriksa status

Proses latar belakang ini mengonsumsi sejumlah kecil token (biasanya di bawah $0.04 per sesi) bahkan tanpa interaksi aktif.

Melacak perubahan versi dan pembaruan

Informasi versi saat ini

Untuk memeriksa versi Claude Code Anda saat ini dan detail instalasi:

claude doctor

Perintah ini menunjukkan versi Anda, jenis instalasi, dan informasi sistem.

Memahami perubahan dalam perilaku Claude Code

Claude Code secara teratur menerima pembaruan yang dapat mengubah cara kerja fitur, termasuk laporan biaya:

  • Pelacakan versi: Gunakan claude doctor untuk melihat versi Anda saat ini
  • Perubahan perilaku: Fitur seperti /cost mungkin menampilkan informasi secara berbeda di berbagai versi
  • Akses dokumentasi: Claude selalu memiliki akses ke dokumentasi terbaru, yang dapat membantu menjelaskan perilaku fitur saat ini

Ketika laporan biaya berubah

Jika Anda melihat perubahan dalam cara biaya ditampilkan (seperti perintah /cost menunjukkan informasi yang berbeda):

  1. Verifikasi versi Anda: Jalankan claude doctor untuk mengonfirmasi versi Anda saat ini
  2. Konsultasi dokumentasi: Tanyakan Claude langsung tentang perilaku fitur saat ini, karena ia memiliki akses ke dokumentasi yang terbaru
  3. Hubungi dukungan: Untuk pertanyaan penagihan spesifik, hubungi dukungan Anthropic melalui akun Console Anda

Untuk deployment tim, kami merekomendasikan memulai dengan kelompok pilot kecil untuk menetapkan pola penggunaan sebelum rollout yang lebih luas.