API Vertex untuk mengakses Claude hampir identik dengan Messages API dan mendukung semua opsi yang sama, dengan dua perbedaan utama:
  • Di Vertex, model tidak dilewatkan dalam badan permintaan. Sebaliknya, itu ditentukan dalam URL endpoint Google Cloud.
  • Di Vertex, anthropic_version dilewatkan dalam badan permintaan (bukan sebagai header), dan harus diatur ke nilai vertex-2023-10-16.
Vertex juga didukung oleh SDK klien resmi Anthropic. Panduan ini akan memandu Anda melalui proses membuat permintaan ke Claude di Vertex AI dalam Python atau TypeScript. Perhatikan bahwa panduan ini mengasumsikan Anda sudah memiliki proyek GCP yang dapat menggunakan Vertex AI. Lihat menggunakan model Claude 3 dari Anthropic untuk informasi lebih lanjut tentang pengaturan yang diperlukan, serta panduan lengkap.

Instal SDK untuk mengakses Vertex AI

Pertama, instal SDK klien Anthropic untuk bahasa pilihan Anda.
pip install -U google-cloud-aiplatform "anthropic[vertex]"

Mengakses Vertex AI

Ketersediaan Model

Perhatikan bahwa ketersediaan model Anthropic bervariasi menurut wilayah. Cari “Claude” di Vertex AI Model Garden atau buka Gunakan Claude 3 untuk informasi terbaru.

ID model API

ModelID model API Vertex AI
Claude Sonnet 4.5claude-sonnet-4-5@20250929Copied!
Claude Sonnet 4claude-sonnet-4@20250514Copied!
Claude Sonnet 3.7 claude-3-7-sonnet@20250219Copied!
Claude Opus 4.1claude-opus-4-1@20250805Copied!
Claude Opus 4claude-opus-4@20250514Copied!
Claude Opus 3 claude-3-opus@20240229Copied!
Claude Haiku 4.5claude-haiku-4-5@20251001Copied!
Claude Haiku 3.5claude-3-5-haiku@20241022Copied!
Claude Haiku 3claude-3-haiku@20240307Copied!

Membuat permintaan

Sebelum menjalankan permintaan, Anda mungkin perlu menjalankan gcloud auth application-default login untuk autentikasi dengan GCP. Contoh berikut menunjukkan cara menghasilkan teks dari Claude di Vertex AI:
from anthropic import AnthropicVertex

project_id = "MY_PROJECT_ID"
region = "global"

client = AnthropicVertex(project_id=project_id, region=region)

message = client.messages.create(
    model="claude-sonnet-4-5@20250929",
    max_tokens=100,
    messages=[
        {
            "role": "user",
            "content": "Hey Claude!",
        }
    ],
)
print(message)
Lihat SDK klien kami dan dokumentasi Vertex AI resmi untuk detail lebih lanjut.

Pencatatan aktivitas

Vertex menyediakan layanan pencatatan permintaan-respons yang memungkinkan pelanggan untuk mencatat prompt dan penyelesaian yang terkait dengan penggunaan Anda. Anthropic merekomendasikan agar Anda mencatat aktivitas Anda setidaknya pada dasar 30 hari bergulir untuk memahami aktivitas Anda dan menyelidiki potensi penyalahgunaan.
Mengaktifkan layanan ini tidak memberikan Google atau Anthropic akses apa pun ke konten Anda.

Dukungan fitur

Anda dapat menemukan semua fitur yang saat ini didukung di Vertex di sini.

Endpoint global vs regional

Mulai dengan Claude Sonnet 4.5 dan semua model di masa depan, Google Vertex AI menawarkan dua jenis endpoint:
  • Endpoint global: Perutean dinamis untuk ketersediaan maksimal
  • Endpoint regional: Perutean data yang dijamin melalui wilayah geografis tertentu
Endpoint regional mencakup premium harga 10% dibandingkan endpoint global.
Ini berlaku untuk Claude Sonnet 4.5 dan model di masa depan saja. Model yang lebih lama (Claude Sonnet 4, Opus 4, dan sebelumnya) mempertahankan struktur harga yang ada.

Kapan menggunakan setiap opsi

Endpoint global (direkomendasikan):
  • Memberikan ketersediaan dan uptime maksimal
  • Secara dinamis merutkan permintaan ke wilayah dengan kapasitas yang tersedia
  • Tidak ada premium harga
  • Terbaik untuk aplikasi di mana residensi data fleksibel
  • Hanya mendukung lalu lintas bayar sesuai penggunaan (throughput yang disediakan memerlukan endpoint regional)
Endpoint regional:
  • Merutkan lalu lintas melalui wilayah geografis tertentu
  • Diperlukan untuk persyaratan residensi data dan kepatuhan
  • Mendukung lalu lintas bayar sesuai penggunaan dan throughput yang disediakan
  • Premium harga 10% mencerminkan biaya infrastruktur untuk kapasitas regional yang didedikasikan

Implementasi

Menggunakan endpoint global (direkomendasikan): Atur parameter region ke "global" saat menginisialisasi klien:
from anthropic import AnthropicVertex

project_id = "MY_PROJECT_ID"
region = "global"

client = AnthropicVertex(project_id=project_id, region=region)

message = client.messages.create(
    model="claude-sonnet-4-5@20250929",
    max_tokens=100,
    messages=[
        {
            "role": "user",
            "content": "Hey Claude!",
        }
    ],
)
print(message)
Menggunakan endpoint regional: Tentukan wilayah tertentu seperti "us-east1" atau "europe-west1":
from anthropic import AnthropicVertex

project_id = "MY_PROJECT_ID"
region = "us-east1"  # Specify a specific region

client = AnthropicVertex(project_id=project_id, region=region)

message = client.messages.create(
    model="claude-sonnet-4-5@20250929",
    max_tokens=100,
    messages=[
        {
            "role": "user",
            "content": "Hey Claude!",
        }
    ],
)
print(message)

Sumber daya tambahan