- Di Vertex,
modeltidak dilewatkan dalam badan permintaan. Sebaliknya, itu ditentukan dalam URL endpoint Google Cloud. - Di Vertex,
anthropic_versiondilewatkan dalam badan permintaan (bukan sebagai header), dan harus diatur ke nilaivertex-2023-10-16.
Instal SDK untuk mengakses Vertex AI
Pertama, instal SDK klien Anthropic untuk bahasa pilihan Anda.Mengakses Vertex AI
Ketersediaan Model
Perhatikan bahwa ketersediaan model Anthropic bervariasi menurut wilayah. Cari “Claude” di Vertex AI Model Garden atau buka Gunakan Claude 3 untuk informasi terbaru.ID model API
| Model | ID model API Vertex AI |
|---|---|
| Claude Sonnet 4.5 | claude-sonnet-4-5@20250929Copied! |
| Claude Sonnet 4 | claude-sonnet-4@20250514Copied! |
| Claude Sonnet 3.7 | claude-3-7-sonnet@20250219Copied! |
| Claude Opus 4.1 | claude-opus-4-1@20250805Copied! |
| Claude Opus 4 | claude-opus-4@20250514Copied! |
| Claude Opus 3 | claude-3-opus@20240229Copied! |
| Claude Haiku 4.5 | claude-haiku-4-5@20251001Copied! |
| Claude Haiku 3.5 | claude-3-5-haiku@20241022Copied! |
| Claude Haiku 3 | claude-3-haiku@20240307Copied! |
Membuat permintaan
Sebelum menjalankan permintaan, Anda mungkin perlu menjalankangcloud auth application-default login untuk autentikasi dengan GCP.
Contoh berikut menunjukkan cara menghasilkan teks dari Claude di Vertex AI:
Pencatatan aktivitas
Vertex menyediakan layanan pencatatan permintaan-respons yang memungkinkan pelanggan untuk mencatat prompt dan penyelesaian yang terkait dengan penggunaan Anda. Anthropic merekomendasikan agar Anda mencatat aktivitas Anda setidaknya pada dasar 30 hari bergulir untuk memahami aktivitas Anda dan menyelidiki potensi penyalahgunaan.Mengaktifkan layanan ini tidak memberikan Google atau Anthropic akses apa pun ke konten Anda.
Dukungan fitur
Anda dapat menemukan semua fitur yang saat ini didukung di Vertex di sini.Endpoint global vs regional
Mulai dengan Claude Sonnet 4.5 dan semua model di masa depan, Google Vertex AI menawarkan dua jenis endpoint:- Endpoint global: Perutean dinamis untuk ketersediaan maksimal
- Endpoint regional: Perutean data yang dijamin melalui wilayah geografis tertentu
Ini berlaku untuk Claude Sonnet 4.5 dan model di masa depan saja. Model yang lebih lama (Claude Sonnet 4, Opus 4, dan sebelumnya) mempertahankan struktur harga yang ada.
Kapan menggunakan setiap opsi
Endpoint global (direkomendasikan):- Memberikan ketersediaan dan uptime maksimal
- Secara dinamis merutkan permintaan ke wilayah dengan kapasitas yang tersedia
- Tidak ada premium harga
- Terbaik untuk aplikasi di mana residensi data fleksibel
- Hanya mendukung lalu lintas bayar sesuai penggunaan (throughput yang disediakan memerlukan endpoint regional)
- Merutkan lalu lintas melalui wilayah geografis tertentu
- Diperlukan untuk persyaratan residensi data dan kepatuhan
- Mendukung lalu lintas bayar sesuai penggunaan dan throughput yang disediakan
- Premium harga 10% mencerminkan biaya infrastruktur untuk kapasitas regional yang didedikasikan
Implementasi
Menggunakan endpoint global (direkomendasikan): Atur parameterregion ke "global" saat menginisialisasi klien:
"us-east1" atau "europe-west1":
Sumber daya tambahan
- Harga Google Vertex AI: cloud.google.com/vertex-ai/generative-ai/pricing
- Dokumentasi model Claude: Claude di Vertex AI
- Postingan blog Google: Endpoint global untuk model Claude
- Detail harga Anthropic: Dokumentasi harga