Prasyarat
Sebelum mengonfigurasi Claude Code dengan Vertex AI, pastikan Anda memiliki:- Akun Google Cloud Platform (GCP) dengan penagihan diaktifkan
- Proyek GCP dengan Vertex AI API diaktifkan
- Akses ke model Claude yang diinginkan (misalnya, Claude Sonnet 4.5)
- Google Cloud SDK (
gcloud) terinstal dan dikonfigurasi - Kuota dialokasikan di wilayah GCP yang diinginkan
Konfigurasi Wilayah
Claude Code dapat digunakan dengan global dan titik akhir regional Vertex AI.Vertex AI mungkin tidak mendukung model default Claude Code di semua wilayah. Anda mungkin perlu beralih ke wilayah atau model yang didukung.
Vertex AI mungkin tidak mendukung model default Claude Code di titik akhir global. Anda mungkin perlu beralih ke titik akhir regional atau model yang didukung.
Pengaturan
1. Aktifkan Vertex AI API
Aktifkan Vertex AI API di proyek GCP Anda:2. Minta akses model
Minta akses ke model Claude di Vertex AI:- Navigasikan ke Vertex AI Model Garden
- Cari model “Claude”
- Minta akses ke model Claude yang diinginkan (misalnya, Claude Sonnet 4.5)
- Tunggu persetujuan (mungkin memakan waktu 24-48 jam)
3. Konfigurasikan kredensial GCP
Claude Code menggunakan autentikasi Google Cloud standar. Untuk informasi lebih lanjut, lihat dokumentasi autentikasi Google Cloud.Saat mengautentikasi, Claude Code akan secara otomatis menggunakan ID proyek dari variabel lingkungan
ANTHROPIC_VERTEX_PROJECT_ID. Untuk menimpanya, atur salah satu variabel lingkungan ini: GCLOUD_PROJECT, GOOGLE_CLOUD_PROJECT, atau GOOGLE_APPLICATION_CREDENTIALS.4. Konfigurasikan Claude Code
Atur variabel lingkungan berikut:Caching prompt secara otomatis didukung ketika Anda menentukan flag ephemeral
cache_control. Untuk menonaktifkannya, atur DISABLE_PROMPT_CACHING=1. Untuk batas laju yang lebih tinggi, hubungi dukungan Google Cloud.Saat menggunakan Vertex AI, perintah
/login dan /logout dinonaktifkan karena autentikasi ditangani melalui kredensial Google Cloud.5. Konfigurasi model
Claude Code menggunakan model default ini untuk Vertex AI:| Jenis model | Nilai default |
|---|---|
| Model utama | claude-sonnet-4-5@20250929 |
| Model kecil/cepat | claude-haiku-4-5@20251001 |
Untuk pengguna Vertex AI, Claude Code tidak akan secara otomatis meningkatkan dari Haiku 3.5 ke Haiku 4.5. Untuk beralih secara manual ke model Haiku yang lebih baru, atur variabel lingkungan
ANTHROPIC_DEFAULT_HAIKU_MODEL ke nama model lengkap (misalnya, claude-haiku-4-5@20251001).Konfigurasi IAM
Tetapkan izin IAM yang diperlukan: Peranroles/aiplatform.user mencakup izin yang diperlukan:
aiplatform.endpoints.predict- Diperlukan untuk invokasi model dan penghitungan token
Kami merekomendasikan membuat proyek GCP khusus untuk Claude Code untuk menyederhanakan pelacakan biaya dan kontrol akses.
Jendela konteks token 1M
Claude Sonnet 4 dan Sonnet 4.5 mendukung jendela konteks token 1M di Vertex AI.Jendela konteks token 1M saat ini dalam beta. Untuk menggunakan jendela konteks yang diperluas, sertakan header beta
context-1m-2025-08-07 dalam permintaan Vertex AI Anda.Pemecahan Masalah
Jika Anda mengalami masalah kuota:- Periksa kuota saat ini atau minta peningkatan kuota melalui Cloud Console
- Konfirmasi model diaktifkan di Model Garden
- Verifikasi Anda memiliki akses ke wilayah yang ditentukan
- Jika menggunakan
CLOUD_ML_REGION=global, periksa bahwa model Anda mendukung titik akhir global di Model Garden di bawah “Supported features”. Untuk model yang tidak mendukung titik akhir global, baik:- Tentukan model yang didukung melalui
ANTHROPIC_MODELatauANTHROPIC_SMALL_FAST_MODEL, atau - Atur titik akhir regional menggunakan variabel lingkungan
VERTEX_REGION_<MODEL_NAME>
- Tentukan model yang didukung melalui
- Untuk titik akhir regional, pastikan model utama dan model kecil/cepat didukung di wilayah pilihan Anda
- Pertimbangkan untuk beralih ke
CLOUD_ML_REGION=globaluntuk ketersediaan yang lebih baik