모델 가격
다음 표는 다양한 사용 계층에서 모든 Claude 모델의 가격을 보여줍니다:| Model | Base Input Tokens | 5m Cache Writes | 1h Cache Writes | Cache Hits & Refreshes | Output Tokens |
|---|---|---|---|---|---|
| Claude Opus 4.1 | $15 / MTok | $18.75 / MTok | $30 / MTok | $1.50 / MTok | $75 / MTok |
| Claude Opus 4 | $15 / MTok | $18.75 / MTok | $30 / MTok | $1.50 / MTok | $75 / MTok |
| Claude Sonnet 4.5 | $3 / MTok | $3.75 / MTok | $6 / MTok | $0.30 / MTok | $15 / MTok |
| Claude Sonnet 4 | $3 / MTok | $3.75 / MTok | $6 / MTok | $0.30 / MTok | $15 / MTok |
| Claude Sonnet 3.7 | $3 / MTok | $3.75 / MTok | $6 / MTok | $0.30 / MTok | $15 / MTok |
| Claude Sonnet 3.5 (deprecated) | $3 / MTok | $3.75 / MTok | $6 / MTok | $0.30 / MTok | $15 / MTok |
| Claude Haiku 4.5 | $1 / MTok | $1.25 / MTok | $2 / MTok | $0.10 / MTok | $5 / MTok |
| Claude Haiku 3.5 | $0.80 / MTok | $1 / MTok | $1.6 / MTok | $0.08 / MTok | $4 / MTok |
| Claude Opus 3 (deprecated) | $15 / MTok | $18.75 / MTok | $30 / MTok | $1.50 / MTok | $75 / MTok |
| Claude Haiku 3 | $0.25 / MTok | $0.30 / MTok | $0.50 / MTok | $0.03 / MTok | $1.25 / MTok |
MTok = 백만 토큰. “Base Input Tokens” 열은 표준 입력 가격을 보여주고, “Cache Writes”와 “Cache Hits”는 프롬프트 캐싱에 특화된 것이며, “Output Tokens”는 출력 가격을 보여줍니다. 프롬프트 캐싱은 다양한 사용 사례에 대한 비용을 최적화하기 위해 5분(기본값)과 1시간 캐시 지속 시간을 모두 제공합니다.위 표는 프롬프트 캐싱에 대한 다음 가격 승수를 반영합니다:
- 5분 캐시 쓰기 토큰은 기본 입력 토큰 가격의 1.25배
- 1시간 캐시 쓰기 토큰은 기본 입력 토큰 가격의 2배
- 캐시 읽기 토큰은 기본 입력 토큰 가격의 0.1배
서드파티 플랫폼 가격
Claude 모델은 AWS Bedrock과 Google Vertex AI에서 이용할 수 있습니다. 공식 가격은 다음을 방문하세요:Claude 4.5 모델 이후의 지역 엔드포인트 가격Claude Sonnet 4.5와 Haiku 4.5부터 AWS Bedrock과 Google Vertex AI는 두 가지 엔드포인트 유형을 제공합니다:
- 글로벌 엔드포인트: 최대 가용성을 위한 지역 간 동적 라우팅
- 지역 엔드포인트: 특정 지리적 지역 내에서 보장되는 데이터 라우팅
기능별 가격
배치 처리
Batch API는 입력 및 출력 토큰 모두에 50% 할인으로 대량 요청의 비동기 처리를 허용합니다.| Model | Batch input | Batch output |
|---|---|---|
| Claude Opus 4.1 | $7.50 / MTok | $37.50 / MTok |
| Claude Opus 4 | $7.50 / MTok | $37.50 / MTok |
| Claude Sonnet 4.5 | $1.50 / MTok | $7.50 / MTok |
| Claude Sonnet 4 | $1.50 / MTok | $7.50 / MTok |
| Claude Sonnet 3.7 | $1.50 / MTok | $7.50 / MTok |
| Claude Sonnet 3.5 (deprecated) | $1.50 / MTok | $7.50 / MTok |
| Claude Haiku 4.5 | $0.50 / MTok | $2.50 / MTok |
| Claude Haiku 3.5 | $0.40 / MTok | $2 / MTok |
| Claude Opus 3 (deprecated) | $7.50 / MTok | $37.50 / MTok |
| Claude Haiku 3 | $0.125 / MTok | $0.625 / MTok |
긴 컨텍스트 가격
1M 토큰 컨텍스트 윈도우가 활성화된 Claude Sonnet 4 또는 Sonnet 4.5를 사용할 때, 200K 입력 토큰을 초과하는 요청은 자동으로 프리미엄 긴 컨텍스트 요금으로 청구됩니다:1M 토큰 컨텍스트 윈도우는 현재 사용 계층 4의 조직과 사용자 정의 속도 제한이 있는 조직에 대해 베타 버전입니다. 1M 토큰 컨텍스트 윈도우는 Claude Sonnet 4와 Sonnet 4.5에서만 사용할 수 있습니다.
| ≤ 200K 입력 토큰 | > 200K 입력 토큰 |
|---|---|
| 입력: $3 / MTok | 입력: $6 / MTok |
| 출력: $15 / MTok | 출력: $22.50 / MTok |
- Batch API 50% 할인이 긴 컨텍스트 가격에 적용됩니다
- 프롬프트 캐싱 승수가 긴 컨텍스트 가격 위에 적용됩니다
베타 플래그가 활성화되어 있어도 200K 입력 토큰 미만의 요청은 표준 요금으로 청구됩니다. 요청이 200K 입력 토큰을 초과하면 모든 토큰에 프리미엄 가격이 적용됩니다.200K 임계값은 입력 토큰(캐시 읽기/쓰기 포함)만을 기준으로 합니다. 출력 토큰 수는 가격 계층 선택에 영향을 주지 않지만, 입력 임계값을 초과할 때 출력 토큰은 더 높은 요금으로 청구됩니다.
usage 객체를 확인하세요:
input_tokenscache_creation_input_tokens(프롬프트 캐싱 사용 시)cache_read_input_tokens(프롬프트 캐싱 사용 시)
usage 객체에 대한 자세한 정보는 API 응답 문서를 참조하세요.
도구 사용 가격
Tool use requests are priced based on:- The total number of input tokens sent to the model (including in the
toolsparameter) - The number of output tokens generated
- For server-side tools, additional usage-based pricing (e.g., web search charges per search performed)
- The
toolsparameter in API requests (tool names, descriptions, and schemas) tool_usecontent blocks in API requests and responsestool_resultcontent blocks in API requests
tools, we also automatically include a special system prompt for the model which enables tool use. The number of tool use tokens required for each model are listed below (excluding the additional tokens listed above). Note that the table assumes at least 1 tool is provided. If no tools are provided, then a tool choice of none uses 0 additional system prompt tokens.
| Model | Tool choice | Tool use system prompt token count |
|---|---|---|
| Claude Opus 4.1 | auto, noneany, tool | 346 tokens 313 tokens |
| Claude Opus 4 | auto, noneany, tool | 346 tokens 313 tokens |
| Claude Sonnet 4.5 | auto, noneany, tool | 346 tokens 313 tokens |
| Claude Sonnet 4 | auto, noneany, tool | 346 tokens 313 tokens |
| Claude Sonnet 3.7 | auto, noneany, tool | 346 tokens 313 tokens |
| Claude Sonnet 3.5 (Oct) (deprecated) | auto, noneany, tool | 346 tokens 313 tokens |
| Claude Sonnet 3.5 (June) (deprecated) | auto, noneany, tool | 294 tokens 261 tokens |
| Claude Haiku 4.5 | auto, noneany, tool | 346 tokens 313 tokens |
| Claude Haiku 3.5 | auto, noneany, tool | 264 tokens 340 tokens |
| Claude Opus 3 (deprecated) | auto, noneany, tool | 530 tokens 281 tokens |
| Claude Sonnet 3 | auto, noneany, tool | 159 tokens 235 tokens |
| Claude Haiku 3 | auto, noneany, tool | 264 tokens 340 tokens |
특정 도구 가격
Bash 도구
The bash tool adds 245 input tokens to your API calls. Additional tokens are consumed by:- Command outputs (stdout/stderr)
- Error messages
- Large file contents
코드 실행 도구
The code execution tool usage is tracked separately from token usage. Execution time is a minimum of 5 minutes. If files are included in the request, execution time is billed even if the tool is not used due to files being preloaded onto the container. Pricing: $0.05 per session-hour.텍스트 편집기 도구
The text editor tool uses the same pricing structure as other tools used with Claude. It follows the standard input and output token pricing based on the Claude model you’re using. In addition to the base tokens, the following additional input tokens are needed for the text editor tool:| Tool | Additional input tokens |
|---|---|
text_editor_20250429 (Claude 4) | 700 tokens |
text_editor_20250124 (Claude Sonnet 3.7) | 700 tokens |
text_editor_20241022 (Claude Sonnet 3.5 (deprecated)) | 700 tokens |
웹 검색 도구
Web search usage is charged in addition to token usage:웹 가져오기 도구
Web fetch usage has no additional charges beyond standard token costs:max_content_tokens parameter to set appropriate limits based on your use case and budget considerations.
Example token usage for typical content:
- Average web page (10KB): ~2,500 tokens
- Large documentation page (100KB): ~25,000 tokens
- Research paper PDF (500KB): ~125,000 tokens
컴퓨터 사용 도구
Computer use follows the standard tool use pricing. When using the computer use tool: System prompt overhead: The computer use beta adds 466-499 tokens to the system prompt Computer use tool token usage:| Model | Input tokens per tool definition |
|---|---|
| Claude 4.x models | 735 tokens |
| Claude Sonnet 3.7 | 735 tokens |
- Screenshot images (see Vision pricing)
- Tool execution results returned to Claude
If you’re also using bash or text editor tools alongside computer use, those tools have their own token costs as documented in their respective pages.
에이전트 사용 사례 가격 예시
Claude로 구축할 때 에이전트 애플리케이션의 가격을 이해하는 것이 중요합니다. 이러한 실제 예시는 다양한 에이전트 패턴의 비용을 추정하는 데 도움이 될 수 있습니다.고객 지원 에이전트 예시
고객 지원 에이전트를 구축할 때 비용이 어떻게 분해될 수 있는지는 다음과 같습니다:10,000개의 지원 티켓 처리에 대한 예시 계산:
- 대화당 평균 ~3,700 토큰
- 입력 15/MTok의 Claude Sonnet 4.5 사용
- 총 비용: 10,000 티켓당 ~$22.20
일반 에이전트 워크플로우 가격
여러 단계가 있는 더 복잡한 에이전트 아키텍처의 경우:-
초기 요청 처리
- 일반적인 입력: 500-1,000 토큰
- 처리 비용: 요청당 ~$0.003
-
메모리 및 컨텍스트 검색
- 검색된 컨텍스트: 2,000-5,000 토큰
- 검색당 비용: 작업당 ~$0.015
-
액션 계획 및 실행
- 계획 토큰: 1,000-2,000
- 실행 피드백: 500-1,000
- 결합 비용: 액션당 ~$0.045
비용 최적화 전략
Claude로 에이전트를 구축할 때:- 적절한 모델 사용: 간단한 작업에는 Haiku, 복잡한 추론에는 Sonnet 선택
- 프롬프트 캐싱 구현: 반복되는 컨텍스트에 대한 비용 절감
- 배치 작업: 시간에 민감하지 않은 작업에 Batch API 사용
- 사용 패턴 모니터링: 토큰 소비를 추적하여 최적화 기회 식별
대용량 에이전트 애플리케이션의 경우 사용자 정의 가격 협정을 위해 엔터프라이즈 영업팀에 문의하는 것을 고려하세요.
추가 가격 고려사항
속도 제한
속도 제한은 사용 계층에 따라 다르며 요청할 수 있는 수에 영향을 줍니다:- 계층 1: 기본 제한이 있는 입문 수준 사용
- 계층 2: 성장하는 애플리케이션을 위한 증가된 제한
- 계층 3: 확립된 애플리케이션을 위한 더 높은 제한
- 계층 4: 최대 표준 제한
- 엔터프라이즈: 사용자 정의 제한 사용 가능
볼륨 할인
대용량 사용자에게는 볼륨 할인이 제공될 수 있습니다. 이는 사례별로 협상됩니다.- 표준 계층은 위에 표시된 가격을 사용합니다
- 엔터프라이즈 고객은 사용자 정의 가격을 위해 영업팀에 문의할 수 있습니다
- 학술 및 연구 할인이 제공될 수 있습니다
엔터프라이즈 가격
특정 요구사항이 있는 엔터프라이즈 고객의 경우:- 사용자 정의 속도 제한
- 볼륨 할인
- 전담 지원
- 사용자 정의 조건
청구 및 결제
- 청구는 실제 사용량을 기준으로 월별 계산됩니다
- 결제는 USD로 처리됩니다
- 신용카드 및 인보이스 옵션 사용 가능
- Claude Console에서 사용량 추적 가능