Claude Code di Google Vertex AI
Pelajari tentang mengonfigurasi Claude Code melalui Google Vertex AI, termasuk pengaturan, konfigurasi IAM, dan pemecahan masalah.
Prasyarat
Sebelum mengonfigurasi Claude Code dengan Vertex AI, pastikan Anda memiliki:
- Akun Google Cloud Platform (GCP) dengan penagihan diaktifkan
- Proyek GCP dengan Vertex AI API diaktifkan
- Akses ke model Claude yang diinginkan (misalnya, Claude Sonnet 4)
- Google Cloud SDK (
gcloud
) terinstal dan dikonfigurasi - Kuota dialokasikan di wilayah GCP yang diinginkan
Konfigurasi Wilayah
Claude Code dapat digunakan dengan endpoint Vertex AI global dan regional.
Vertex AI mungkin tidak mendukung model default Claude Code di semua wilayah. Anda mungkin perlu beralih ke wilayah atau model yang didukung.
Vertex AI mungkin tidak mendukung model default Claude Code di endpoint global. Anda mungkin perlu beralih ke endpoint regional atau model yang didukung.
Pengaturan
1. Aktifkan Vertex AI API
Aktifkan Vertex AI API di proyek GCP Anda:
2. Minta akses model
Minta akses ke model Claude di Vertex AI:
- Navigasi ke Vertex AI Model Garden
- Cari model “Claude”
- Minta akses ke model Claude yang diinginkan (misalnya, Claude Sonnet 4)
- Tunggu persetujuan (mungkin memakan waktu 24-48 jam)
3. Konfigurasi kredensial GCP
Claude Code menggunakan autentikasi Google Cloud standar.
Untuk informasi lebih lanjut, lihat dokumentasi autentikasi Google Cloud.
Saat melakukan autentikasi, Claude Code akan secara otomatis menggunakan ID proyek dari variabel lingkungan ANTHROPIC_VERTEX_PROJECT_ID
. Untuk mengganti ini, atur salah satu dari variabel lingkungan berikut: GCLOUD_PROJECT
, GOOGLE_CLOUD_PROJECT
, atau GOOGLE_APPLICATION_CREDENTIALS
.
4. Konfigurasi Claude Code
Atur variabel lingkungan berikut:
Prompt caching secara otomatis didukung ketika Anda menentukan flag ephemeral cache_control
. Untuk menonaktifkannya, atur DISABLE_PROMPT_CACHING=1
. Untuk batas tingkat yang lebih tinggi, hubungi dukungan Google Cloud.
Saat menggunakan Vertex AI, perintah /login
dan /logout
dinonaktifkan karena autentikasi ditangani melalui kredensial Google Cloud.
5. Konfigurasi model
Claude Code menggunakan model default berikut untuk Vertex AI:
Jenis model | Nilai default |
---|---|
Model utama | claude-sonnet-4@20250514 |
Model kecil/cepat | claude-3-5-haiku@20241022 |
Untuk menyesuaikan model:
Konfigurasi IAM
Tetapkan izin IAM yang diperlukan:
Peran roles/aiplatform.user
mencakup izin yang diperlukan:
aiplatform.endpoints.predict
- Diperlukan untuk pemanggilan modelaiplatform.endpoints.computeTokens
- Diperlukan untuk penghitungan token
Untuk izin yang lebih restriktif, buat peran kustom dengan hanya izin di atas.
Untuk detail, lihat dokumentasi IAM Vertex.
Kami merekomendasikan membuat proyek GCP khusus untuk Claude Code untuk menyederhanakan pelacakan biaya dan kontrol akses.
Jendela konteks 1M token
Claude Sonnet 4 mendukung jendela konteks 1M token di Vertex AI.
Jendela konteks 1M token saat ini dalam beta. Untuk menggunakan jendela konteks yang diperluas, sertakan header beta context-1m-2025-08-07
dalam permintaan Vertex AI Anda.
Pemecahan Masalah
Jika Anda mengalami masalah kuota:
- Periksa kuota saat ini atau minta peningkatan kuota melalui Cloud Console
Jika Anda mengalami kesalahan 404 “model not found”:
- Konfirmasi model Diaktifkan di Model Garden
- Verifikasi Anda memiliki akses ke wilayah yang ditentukan
- Jika menggunakan
CLOUD_ML_REGION=global
, periksa bahwa model Anda mendukung endpoint global di Model Garden di bawah “Supported features”. Untuk model yang tidak mendukung endpoint global, baik:- Tentukan model yang didukung melalui
ANTHROPIC_MODEL
atauANTHROPIC_SMALL_FAST_MODEL
, atau - Atur endpoint regional menggunakan variabel lingkungan
VERTEX_REGION_<MODEL_NAME>
- Tentukan model yang didukung melalui
Jika Anda mengalami kesalahan 429:
- Untuk endpoint regional, pastikan model utama dan model kecil/cepat didukung di wilayah yang Anda pilih
- Pertimbangkan untuk beralih ke
CLOUD_ML_REGION=global
untuk ketersediaan yang lebih baik