필수 조건
Claude Code를 Vertex AI로 구성하기 전에 다음을 확인하세요:- 청구가 활성화된 Google Cloud Platform(GCP) 계정
- Vertex AI API가 활성화된 GCP 프로젝트
- 원하는 Claude 모델에 대한 액세스(예: Claude Sonnet 4.5)
- Google Cloud SDK(
gcloud) 설치 및 구성 - 원하는 GCP 지역에 할당된 할당량
지역 구성
Claude Code는 Vertex AI 글로벌 및 지역 엔드포인트 모두에서 사용할 수 있습니다.Vertex AI는 모든 지역에서 Claude Code 기본 모델을 지원하지 않을 수 있습니다. 지원되는 지역 또는 모델로 전환해야 할 수 있습니다.
Vertex AI는 글로벌 엔드포인트에서 Claude Code 기본 모델을 지원하지 않을 수 있습니다. 지역 엔드포인트 또는 지원되는 모델로 전환해야 할 수 있습니다.
설정
1. Vertex AI API 활성화
GCP 프로젝트에서 Vertex AI API를 활성화합니다:2. 모델 액세스 요청
Vertex AI에서 Claude 모델에 대한 액세스를 요청합니다:- Vertex AI Model Garden으로 이동합니다
- “Claude” 모델을 검색합니다
- 원하는 Claude 모델(예: Claude Sonnet 4.5)에 대한 액세스를 요청합니다
- 승인을 기다립니다(24-48시간이 소요될 수 있음)
3. GCP 자격증명 구성
Claude Code는 표준 Google Cloud 인증을 사용합니다. 자세한 내용은 Google Cloud 인증 설명서를 참조하세요.인증할 때 Claude Code는
ANTHROPIC_VERTEX_PROJECT_ID 환경 변수에서 프로젝트 ID를 자동으로 사용합니다. 이를 재정의하려면 다음 환경 변수 중 하나를 설정하세요: GCLOUD_PROJECT, GOOGLE_CLOUD_PROJECT 또는 GOOGLE_APPLICATION_CREDENTIALS.4. Claude Code 구성
다음 환경 변수를 설정합니다:프롬프트 캐싱은
cache_control 임시 플래그를 지정할 때 자동으로 지원됩니다. 이를 비활성화하려면 DISABLE_PROMPT_CACHING=1을 설정하세요. 향상된 속도 제한을 위해 Google Cloud 지원팀에 문의하세요.Vertex AI를 사용할 때
/login 및 /logout 명령은 Google Cloud 자격증명을 통해 인증이 처리되므로 비활성화됩니다.5. 모델 구성
Claude Code는 Vertex AI에 대해 다음 기본 모델을 사용합니다:| 모델 유형 | 기본값 |
|---|---|
| 주 모델 | claude-sonnet-4-5@20250929 |
| 소형/빠른 모델 | claude-haiku-4-5@20251001 |
Vertex AI 사용자의 경우 Claude Code는 Haiku 3.5에서 Haiku 4.5로 자동으로 업그레이드되지 않습니다. 더 새로운 Haiku 모델로 수동으로 전환하려면
ANTHROPIC_DEFAULT_HAIKU_MODEL 환경 변수를 전체 모델 이름(예: claude-haiku-4-5@20251001)으로 설정하세요.IAM 구성
필요한 IAM 권한을 할당합니다:roles/aiplatform.user 역할에는 필요한 권한이 포함됩니다:
aiplatform.endpoints.predict- 모델 호출 및 토큰 계산에 필요
비용 추적 및 액세스 제어를 단순화하기 위해 Claude Code용 전용 GCP 프로젝트를 만드는 것을 권장합니다.
1M 토큰 컨텍스트 윈도우
Claude Sonnet 4 및 Sonnet 4.5는 Vertex AI에서 1M 토큰 컨텍스트 윈도우를 지원합니다.1M 토큰 컨텍스트 윈도우는 현재 베타 버전입니다. 확장된 컨텍스트 윈도우를 사용하려면 Vertex AI 요청에
context-1m-2025-08-07 베타 헤더를 포함하세요.문제 해결
할당량 문제가 발생하면:- Cloud Console을 통해 현재 할당량을 확인하거나 할당량 증가를 요청합니다
- Model Garden에서 모델이 활성화되어 있는지 확인합니다
- 지정된 지역에 액세스할 수 있는지 확인합니다
CLOUD_ML_REGION=global을 사용하는 경우 Model Garden의 “지원되는 기능”에서 모델이 글로벌 엔드포인트를 지원하는지 확인합니다. 글로벌 엔드포인트를 지원하지 않는 모델의 경우:ANTHROPIC_MODEL또는ANTHROPIC_SMALL_FAST_MODEL을 통해 지원되는 모델을 지정하거나VERTEX_REGION_<MODEL_NAME>환경 변수를 사용하여 지역 엔드포인트를 설정합니다
- 지역 엔드포인트의 경우 주 모델과 소형/빠른 모델이 선택한 지역에서 지원되는지 확인합니다
- 더 나은 가용성을 위해
CLOUD_ML_REGION=global로 전환하는 것을 고려합니다