Цены на модели
В следующей таблице показаны цены на все модели Claude для различных уровней использования:| Model | Base Input Tokens | 5m Cache Writes | 1h Cache Writes | Cache Hits & Refreshes | Output Tokens |
|---|---|---|---|---|---|
| Claude Opus 4.1 | $15 / MTok | $18.75 / MTok | $30 / MTok | $1.50 / MTok | $75 / MTok |
| Claude Opus 4 | $15 / MTok | $18.75 / MTok | $30 / MTok | $1.50 / MTok | $75 / MTok |
| Claude Sonnet 4.5 | $3 / MTok | $3.75 / MTok | $6 / MTok | $0.30 / MTok | $15 / MTok |
| Claude Sonnet 4 | $3 / MTok | $3.75 / MTok | $6 / MTok | $0.30 / MTok | $15 / MTok |
| Claude Sonnet 3.7 (deprecated) | $3 / MTok | $3.75 / MTok | $6 / MTok | $0.30 / MTok | $15 / MTok |
| Claude Haiku 4.5 | $1 / MTok | $1.25 / MTok | $2 / MTok | $0.10 / MTok | $5 / MTok |
| Claude Haiku 3.5 | $0.80 / MTok | $1 / MTok | $1.6 / MTok | $0.08 / MTok | $4 / MTok |
| Claude Opus 3 (deprecated) | $15 / MTok | $18.75 / MTok | $30 / MTok | $1.50 / MTok | $75 / MTok |
| Claude Haiku 3 | $0.25 / MTok | $0.30 / MTok | $0.50 / MTok | $0.03 / MTok | $1.25 / MTok |
MTok = Миллион токенов. Столбец “Base Input Tokens” показывает стандартные цены на входные данные, “Cache Writes” и “Cache Hits” относятся к кэшированию промптов, а “Output Tokens” показывает цены на выходные данные. Кэширование промптов предлагает длительность кэша как 5 минут (по умолчанию), так и 1 час для оптимизации затрат для различных случаев использования.Таблица выше отражает следующие ценовые множители для кэширования промптов:
- Токены записи в 5-минутный кэш стоят в 1,25 раза больше базовой цены входных токенов
- Токены записи в 1-часовой кэш стоят в 2 раза больше базовой цены входных токенов
- Токены чтения из кэша стоят в 0,1 раза меньше базовой цены входных токенов
Цены на сторонних платформах
Модели Claude доступны на AWS Bedrock и Google Vertex AI. Для официальных цен посетите:Цены на региональные конечные точки для моделей Claude 4.5 и вышеНачиная с Claude Sonnet 4.5 и Haiku 4.5, AWS Bedrock и Google Vertex AI предлагают два типа конечных точек:
- Глобальные конечные точки: Динамическая маршрутизация между регионами для максимальной доступности
- Региональные конечные точки: Гарантированная маршрутизация данных в пределах определенных географических регионов
Цены на специфические функции
Пакетная обработка
Batch API позволяет асинхронную обработку больших объемов запросов со скидкой 50% как на входные, так и на выходные токены.| Model | Batch input | Batch output |
|---|---|---|
| Claude Opus 4.1 | $7.50 / MTok | $37.50 / MTok |
| Claude Opus 4 | $7.50 / MTok | $37.50 / MTok |
| Claude Sonnet 4.5 | $1.50 / MTok | $7.50 / MTok |
| Claude Sonnet 4 | $1.50 / MTok | $7.50 / MTok |
| Claude Sonnet 3.7 (deprecated) | $1.50 / MTok | $7.50 / MTok |
| Claude Haiku 4.5 | $0.50 / MTok | $2.50 / MTok |
| Claude Haiku 3.5 | $0.40 / MTok | $2 / MTok |
| Claude Opus 3 (deprecated) | $7.50 / MTok | $37.50 / MTok |
| Claude Haiku 3 | $0.125 / MTok | $0.625 / MTok |
Цены на длинный контекст
При использовании Claude Sonnet 4 или Sonnet 4.5 с включенным окном контекста в 1M токенов, запросы, превышающие 200K входных токенов, автоматически тарифицируются по премиальным тарифам длинного контекста:Окно контекста в 1M токенов в настоящее время находится в бета-версии для организаций в уровне использования 4 и организаций с пользовательскими лимитами скорости. Окно контекста в 1M токенов доступно только для Claude Sonnet 4 и Sonnet 4.5.
| ≤ 200K входных токенов | > 200K входных токенов |
|---|---|
| Входные: $3 / MTok | Входные: $6 / MTok |
| Выходные: $15 / MTok | Выходные: $22.50 / MTok |
- Скидка 50% Batch API применяется к ценам на длинный контекст
- Множители кэширования промптов применяются поверх цен на длинный контекст
Даже с включенным бета-флагом запросы с менее чем 200K входных токенов тарифицируются по стандартным тарифам. Если ваш запрос превышает 200K входных токенов, все токены облагаются премиальным тарифом.Порог в 200K основан исключительно на входных токенах (включая чтения/записи кэша). Количество выходных токенов не влияет на выбор ценового уровня, хотя выходные токены тарифицируются по более высокому тарифу при превышении входного порога.
usage в ответе API:
input_tokenscache_creation_input_tokens(при использовании кэширования промптов)cache_read_input_tokens(при использовании кэширования промптов)
usage см. документацию по ответу API.
Цены на использование инструментов
Tool use requests are priced based on:- The total number of input tokens sent to the model (including in the
toolsparameter) - The number of output tokens generated
- For server-side tools, additional usage-based pricing (e.g., web search charges per search performed)
- The
toolsparameter in API requests (tool names, descriptions, and schemas) tool_usecontent blocks in API requests and responsestool_resultcontent blocks in API requests
tools, we also automatically include a special system prompt for the model which enables tool use. The number of tool use tokens required for each model are listed below (excluding the additional tokens listed above). Note that the table assumes at least 1 tool is provided. If no tools are provided, then a tool choice of none uses 0 additional system prompt tokens.
| Model | Tool choice | Tool use system prompt token count |
|---|---|---|
| Claude Opus 4.1 | auto, noneany, tool | 346 tokens 313 tokens |
| Claude Opus 4 | auto, noneany, tool | 346 tokens 313 tokens |
| Claude Sonnet 4.5 | auto, noneany, tool | 346 tokens 313 tokens |
| Claude Sonnet 4 | auto, noneany, tool | 346 tokens 313 tokens |
| Claude Sonnet 3.7 (deprecated) | auto, noneany, tool | 346 tokens 313 tokens |
| Claude Haiku 4.5 | auto, noneany, tool | 346 tokens 313 tokens |
| Claude Haiku 3.5 | auto, noneany, tool | 264 tokens 340 tokens |
| Claude Opus 3 (deprecated) | auto, noneany, tool | 530 tokens 281 tokens |
| Claude Sonnet 3 | auto, noneany, tool | 159 tokens 235 tokens |
| Claude Haiku 3 | auto, noneany, tool | 264 tokens 340 tokens |
Цены на конкретные инструменты
Инструмент Bash
The bash tool adds 245 input tokens to your API calls. Additional tokens are consumed by:- Command outputs (stdout/stderr)
- Error messages
- Large file contents
Инструмент выполнения кода
Code execution tool usage is tracked separately from token usage. Execution time has a minimum of 5 minutes. If files are included in the request, execution time is billed even if the tool is not used due to files being preloaded onto the container. Each organization receives 50 free hours of usage with the code execution tool per day. Additional usage beyond the first 50 hours is billed at $0.05 per hour, per container.Инструмент текстового редактора
The text editor tool uses the same pricing structure as other tools used with Claude. It follows the standard input and output token pricing based on the Claude model you’re using. In addition to the base tokens, the following additional input tokens are needed for the text editor tool:| Tool | Additional input tokens |
|---|---|
text_editor_20250429 (Claude 4.x) | 700 tokens |
text_editor_20250124 (Claude Sonnet 3.7 (deprecated)) | 700 tokens |
Инструмент веб-поиска
Web search usage is charged in addition to token usage:Инструмент веб-получения
Web fetch usage has no additional charges beyond standard token costs:max_content_tokens parameter to set appropriate limits based on your use case and budget considerations.
Example token usage for typical content:
- Average web page (10KB): ~2,500 tokens
- Large documentation page (100KB): ~25,000 tokens
- Research paper PDF (500KB): ~125,000 tokens
Инструмент использования компьютера
Computer use follows the standard tool use pricing. When using the computer use tool: System prompt overhead: The computer use beta adds 466-499 tokens to the system prompt Computer use tool token usage:| Model | Input tokens per tool definition |
|---|---|
| Claude 4.x models | 735 tokens |
| Claude Sonnet 3.7 (deprecated) | 735 tokens |
- Screenshot images (see Vision pricing)
- Tool execution results returned to Claude
If you’re also using bash or text editor tools alongside computer use, those tools have their own token costs as documented in their respective pages.
Примеры ценообразования для случаев использования агентов
Понимание ценообразования для агентских приложений имеет решающее значение при создании с Claude. Эти реальные примеры могут помочь вам оценить затраты для различных паттернов агентов.Пример агента поддержки клиентов
При создании агента поддержки клиентов затраты могут распределяться следующим образом:Пример расчета для обработки 10,000 заявок поддержки:
- В среднем ~3,700 токенов на разговор
- Использование Claude Sonnet 4.5 по 15/MTok выходные
- Общая стоимость: ~$22.20 за 10,000 заявок
Общее ценообразование рабочего процесса агента
Для более сложных агентских архитектур с несколькими шагами:-
Обработка первоначального запроса
- Типичные входные данные: 500-1,000 токенов
- Стоимость обработки: ~$0.003 за запрос
-
Извлечение памяти и контекста
- Извлеченный контекст: 2,000-5,000 токенов
- Стоимость за извлечение: ~$0.015 за операцию
-
Планирование и выполнение действий
- Токены планирования: 1,000-2,000
- Обратная связь выполнения: 500-1,000
- Общая стоимость: ~$0.045 за действие
Стратегии оптимизации затрат
При создании агентов с Claude:- Используйте подходящие модели: Выбирайте Haiku для простых задач, Sonnet для сложного рассуждения
- Реализуйте кэширование промптов: Снижайте затраты на повторяющийся контекст
- Пакетные операции: Используйте Batch API для задач, не критичных по времени
- Мониторьте паттерны использования: Отслеживайте потребление токенов для выявления возможностей оптимизации
Для высоконагруженных агентских приложений рассмотрите возможность обращения к нашей команде корпоративных продаж для индивидуальных ценовых соглашений.
Дополнительные соображения по ценообразованию
Лимиты скорости
Лимиты скорости варьируются в зависимости от уровня использования и влияют на количество запросов, которые вы можете делать:- Уровень 1: Начальное использование с базовыми лимитами
- Уровень 2: Увеличенные лимиты для растущих приложений
- Уровень 3: Более высокие лимиты для устоявшихся приложений
- Уровень 4: Максимальные стандартные лимиты
- Корпоративный: Доступны пользовательские лимиты
Скидки за объем
Скидки за объем могут быть доступны для пользователей с большими объемами. Они обсуждаются в индивидуальном порядке.- Стандартные уровни используют ценообразование, показанное выше
- Корпоративные клиенты могут связаться с отделом продаж для индивидуального ценообразования
- Могут быть доступны академические и исследовательские скидки
Корпоративное ценообразование
Для корпоративных клиентов со специфическими потребностями:- Пользовательские лимиты скорости
- Скидки за объем
- Выделенная поддержка
- Индивидуальные условия
Выставление счетов и платежи
- Выставление счетов рассчитывается ежемесячно на основе фактического использования
- Платежи обрабатываются в долларах США
- Доступны варианты кредитной карты и выставления счетов
- Отслеживание использования доступно в Claude Console