Эта страница предоставляет подробную информацию о ценах на модели и функции Anthropic. Все цены указаны в долларах США. Для получения самой актуальной информации о ценах посетите claude.com/pricing.

Цены на модели

В следующей таблице показаны цены на все модели Claude для различных уровней использования:
ModelBase Input Tokens5m Cache Writes1h Cache WritesCache Hits & RefreshesOutput Tokens
Claude Opus 4.1$15 / MTok$18.75 / MTok$30 / MTok$1.50 / MTok$75 / MTok
Claude Opus 4$15 / MTok$18.75 / MTok$30 / MTok$1.50 / MTok$75 / MTok
Claude Sonnet 4.5$3 / MTok$3.75 / MTok$6 / MTok$0.30 / MTok$15 / MTok
Claude Sonnet 4$3 / MTok$3.75 / MTok$6 / MTok$0.30 / MTok$15 / MTok
Claude Sonnet 3.7 (deprecated)$3 / MTok$3.75 / MTok$6 / MTok$0.30 / MTok$15 / MTok
Claude Haiku 4.5$1 / MTok$1.25 / MTok$2 / MTok$0.10 / MTok$5 / MTok
Claude Haiku 3.5$0.80 / MTok$1 / MTok$1.6 / MTok$0.08 / MTok$4 / MTok
Claude Opus 3 (deprecated)$15 / MTok$18.75 / MTok$30 / MTok$1.50 / MTok$75 / MTok
Claude Haiku 3$0.25 / MTok$0.30 / MTok$0.50 / MTok$0.03 / MTok$1.25 / MTok
MTok = Миллион токенов. Столбец “Base Input Tokens” показывает стандартные цены на входные данные, “Cache Writes” и “Cache Hits” относятся к кэшированию промптов, а “Output Tokens” показывает цены на выходные данные. Кэширование промптов предлагает длительность кэша как 5 минут (по умолчанию), так и 1 час для оптимизации затрат для различных случаев использования.Таблица выше отражает следующие ценовые множители для кэширования промптов:
  • Токены записи в 5-минутный кэш стоят в 1,25 раза больше базовой цены входных токенов
  • Токены записи в 1-часовой кэш стоят в 2 раза больше базовой цены входных токенов
  • Токены чтения из кэша стоят в 0,1 раза меньше базовой цены входных токенов

Цены на сторонних платформах

Модели Claude доступны на AWS Bedrock и Google Vertex AI. Для официальных цен посетите:
Цены на региональные конечные точки для моделей Claude 4.5 и вышеНачиная с Claude Sonnet 4.5 и Haiku 4.5, AWS Bedrock и Google Vertex AI предлагают два типа конечных точек:
  • Глобальные конечные точки: Динамическая маршрутизация между регионами для максимальной доступности
  • Региональные конечные точки: Гарантированная маршрутизация данных в пределах определенных географических регионов
Региональные конечные точки включают надбавку в 10% по сравнению с глобальными конечными точками. API Claude (1P) является глобальным по умолчанию и не затрагивается этим изменением. API Claude является только глобальным (эквивалентно предложению глобальных конечных точек и ценообразованию от других провайдеров).Область применения: Эта структура ценообразования применяется к Claude Sonnet 4.5, Haiku 4.5 и всем будущим моделям. Более ранние модели (Claude Sonnet 4, Opus 4 и предыдущие выпуски) сохраняют свое существующее ценообразование.Для деталей реализации и примеров кода:

Цены на специфические функции

Пакетная обработка

Batch API позволяет асинхронную обработку больших объемов запросов со скидкой 50% как на входные, так и на выходные токены.
ModelBatch inputBatch output
Claude Opus 4.1$7.50 / MTok$37.50 / MTok
Claude Opus 4$7.50 / MTok$37.50 / MTok
Claude Sonnet 4.5$1.50 / MTok$7.50 / MTok
Claude Sonnet 4$1.50 / MTok$7.50 / MTok
Claude Sonnet 3.7 (deprecated)$1.50 / MTok$7.50 / MTok
Claude Haiku 4.5$0.50 / MTok$2.50 / MTok
Claude Haiku 3.5$0.40 / MTok$2 / MTok
Claude Opus 3 (deprecated)$7.50 / MTok$37.50 / MTok
Claude Haiku 3$0.125 / MTok$0.625 / MTok
Для получения дополнительной информации о пакетной обработке см. нашу документацию по пакетной обработке.

Цены на длинный контекст

При использовании Claude Sonnet 4 или Sonnet 4.5 с включенным окном контекста в 1M токенов, запросы, превышающие 200K входных токенов, автоматически тарифицируются по премиальным тарифам длинного контекста:
Окно контекста в 1M токенов в настоящее время находится в бета-версии для организаций в уровне использования 4 и организаций с пользовательскими лимитами скорости. Окно контекста в 1M токенов доступно только для Claude Sonnet 4 и Sonnet 4.5.
≤ 200K входных токенов> 200K входных токенов
Входные: $3 / MTokВходные: $6 / MTok
Выходные: $15 / MTokВыходные: $22.50 / MTok
Цены на длинный контекст складываются с другими ценовыми модификаторами:
Даже с включенным бета-флагом запросы с менее чем 200K входных токенов тарифицируются по стандартным тарифам. Если ваш запрос превышает 200K входных токенов, все токены облагаются премиальным тарифом.Порог в 200K основан исключительно на входных токенах (включая чтения/записи кэша). Количество выходных токенов не влияет на выбор ценового уровня, хотя выходные токены тарифицируются по более высокому тарифу при превышении входного порога.
Чтобы проверить, был ли ваш API-запрос тарифицирован по тарифам окна контекста в 1M, изучите объект usage в ответе API:
{
  "usage": {
    "input_tokens": 250000,
    "cache_creation_input_tokens": 0,
    "cache_read_input_tokens": 0,
    "output_tokens": 500
  }
}
Рассчитайте общее количество входных токенов, суммируя:
  • input_tokens
  • cache_creation_input_tokens (при использовании кэширования промптов)
  • cache_read_input_tokens (при использовании кэширования промптов)
Если общее количество превышает 200,000 токенов, весь запрос был тарифицирован по тарифам контекста в 1M. Для получения дополнительной информации об объекте usage см. документацию по ответу API.

Цены на использование инструментов

Tool use requests are priced based on:
  1. The total number of input tokens sent to the model (including in the tools parameter)
  2. The number of output tokens generated
  3. For server-side tools, additional usage-based pricing (e.g., web search charges per search performed)
Client-side tools are priced the same as any other Claude API request, while server-side tools may incur additional charges based on their specific usage. The additional tokens from tool use come from:
  • The tools parameter in API requests (tool names, descriptions, and schemas)
  • tool_use content blocks in API requests and responses
  • tool_result content blocks in API requests
When you use tools, we also automatically include a special system prompt for the model which enables tool use. The number of tool use tokens required for each model are listed below (excluding the additional tokens listed above). Note that the table assumes at least 1 tool is provided. If no tools are provided, then a tool choice of none uses 0 additional system prompt tokens.
ModelTool choiceTool use system prompt token count
Claude Opus 4.1auto, none
any, tool
346 tokens
313 tokens
Claude Opus 4auto, none
any, tool
346 tokens
313 tokens
Claude Sonnet 4.5auto, none
any, tool
346 tokens
313 tokens
Claude Sonnet 4auto, none
any, tool
346 tokens
313 tokens
Claude Sonnet 3.7 (deprecated)auto, none
any, tool
346 tokens
313 tokens
Claude Haiku 4.5auto, none
any, tool
346 tokens
313 tokens
Claude Haiku 3.5auto, none
any, tool
264 tokens
340 tokens
Claude Opus 3 (deprecated)auto, none
any, tool
530 tokens
281 tokens
Claude Sonnet 3auto, none
any, tool
159 tokens
235 tokens
Claude Haiku 3auto, none
any, tool
264 tokens
340 tokens
These token counts are added to your normal input and output tokens to calculate the total cost of a request. Для текущих цен по моделям обратитесь к нашему разделу цены на модели выше. Для получения дополнительной информации о реализации использования инструментов и лучших практиках см. нашу документацию по использованию инструментов.

Цены на конкретные инструменты

Инструмент Bash

The bash tool adds 245 input tokens to your API calls. Additional tokens are consumed by:
  • Command outputs (stdout/stderr)
  • Error messages
  • Large file contents
См. цены на использование инструментов для полных деталей ценообразования.

Инструмент выполнения кода

Code execution tool usage is tracked separately from token usage. Execution time has a minimum of 5 minutes. If files are included in the request, execution time is billed even if the tool is not used due to files being preloaded onto the container. Each organization receives 50 free hours of usage with the code execution tool per day. Additional usage beyond the first 50 hours is billed at $0.05 per hour, per container.

Инструмент текстового редактора

The text editor tool uses the same pricing structure as other tools used with Claude. It follows the standard input and output token pricing based on the Claude model you’re using. In addition to the base tokens, the following additional input tokens are needed for the text editor tool:
ToolAdditional input tokens
text_editor_20250429 (Claude 4.x)700 tokens
text_editor_20250124 (Claude Sonnet 3.7 (deprecated))700 tokens
См. цены на использование инструментов для полных деталей ценообразования.

Инструмент веб-поиска

Web search usage is charged in addition to token usage:
"usage": {
  "input_tokens": 105,
  "output_tokens": 6039,
  "cache_read_input_tokens": 7123,
  "cache_creation_input_tokens": 7345,
  "server_tool_use": {
    "web_search_requests": 1
  }
}
Web search is available on the Claude API for $10 per 1,000 searches, plus standard token costs for search-generated content. Web search results retrieved throughout a conversation are counted as input tokens, in search iterations executed during a single turn and in subsequent conversation turns. Each web search counts as one use, regardless of the number of results returned. If an error occurs during web search, the web search will not be billed.

Инструмент веб-получения

Web fetch usage has no additional charges beyond standard token costs:
"usage": {
  "input_tokens": 25039,
  "output_tokens": 931,
  "cache_read_input_tokens": 0,
  "cache_creation_input_tokens": 0,
  "server_tool_use": {
    "web_fetch_requests": 1
  }
}
The web fetch tool is available on the Claude API at no additional cost. You only pay standard token costs for the fetched content that becomes part of your conversation context. To protect against inadvertently fetching large content that would consume excessive tokens, use the max_content_tokens parameter to set appropriate limits based on your use case and budget considerations. Example token usage for typical content:
  • Average web page (10KB): ~2,500 tokens
  • Large documentation page (100KB): ~25,000 tokens
  • Research paper PDF (500KB): ~125,000 tokens

Инструмент использования компьютера

Computer use follows the standard tool use pricing. When using the computer use tool: System prompt overhead: The computer use beta adds 466-499 tokens to the system prompt Computer use tool token usage:
ModelInput tokens per tool definition
Claude 4.x models735 tokens
Claude Sonnet 3.7 (deprecated)735 tokens
Additional token consumption:
  • Screenshot images (see Vision pricing)
  • Tool execution results returned to Claude
If you’re also using bash or text editor tools alongside computer use, those tools have their own token costs as documented in their respective pages.

Примеры ценообразования для случаев использования агентов

Понимание ценообразования для агентских приложений имеет решающее значение при создании с Claude. Эти реальные примеры могут помочь вам оценить затраты для различных паттернов агентов.

Пример агента поддержки клиентов

При создании агента поддержки клиентов затраты могут распределяться следующим образом:
Пример расчета для обработки 10,000 заявок поддержки:
  • В среднем ~3,700 токенов на разговор
  • Использование Claude Sonnet 4.5 по 3/MTokвходные,3/MTok входные, 15/MTok выходные
  • Общая стоимость: ~$22.20 за 10,000 заявок
Для подробного разбора этого расчета см. наше руководство по агенту поддержки клиентов.

Общее ценообразование рабочего процесса агента

Для более сложных агентских архитектур с несколькими шагами:
  1. Обработка первоначального запроса
    • Типичные входные данные: 500-1,000 токенов
    • Стоимость обработки: ~$0.003 за запрос
  2. Извлечение памяти и контекста
    • Извлеченный контекст: 2,000-5,000 токенов
    • Стоимость за извлечение: ~$0.015 за операцию
  3. Планирование и выполнение действий
    • Токены планирования: 1,000-2,000
    • Обратная связь выполнения: 500-1,000
    • Общая стоимость: ~$0.045 за действие
Для всестороннего руководства по паттернам ценообразования агентов см. наше руководство по случаям использования агентов.

Стратегии оптимизации затрат

При создании агентов с Claude:
  1. Используйте подходящие модели: Выбирайте Haiku для простых задач, Sonnet для сложного рассуждения
  2. Реализуйте кэширование промптов: Снижайте затраты на повторяющийся контекст
  3. Пакетные операции: Используйте Batch API для задач, не критичных по времени
  4. Мониторьте паттерны использования: Отслеживайте потребление токенов для выявления возможностей оптимизации
Для высоконагруженных агентских приложений рассмотрите возможность обращения к нашей команде корпоративных продаж для индивидуальных ценовых соглашений.

Дополнительные соображения по ценообразованию

Лимиты скорости

Лимиты скорости варьируются в зависимости от уровня использования и влияют на количество запросов, которые вы можете делать:
  • Уровень 1: Начальное использование с базовыми лимитами
  • Уровень 2: Увеличенные лимиты для растущих приложений
  • Уровень 3: Более высокие лимиты для устоявшихся приложений
  • Уровень 4: Максимальные стандартные лимиты
  • Корпоративный: Доступны пользовательские лимиты
Для подробной информации о лимитах скорости см. нашу документацию по лимитам скорости. Для более высоких лимитов скорости или индивидуальных ценовых соглашений свяжитесь с нашей командой продаж.

Скидки за объем

Скидки за объем могут быть доступны для пользователей с большими объемами. Они обсуждаются в индивидуальном порядке.
  • Стандартные уровни используют ценообразование, показанное выше
  • Корпоративные клиенты могут связаться с отделом продаж для индивидуального ценообразования
  • Могут быть доступны академические и исследовательские скидки

Корпоративное ценообразование

Для корпоративных клиентов со специфическими потребностями:
  • Пользовательские лимиты скорости
  • Скидки за объем
  • Выделенная поддержка
  • Индивидуальные условия
Свяжитесь с нашей командой продаж по адресу [email protected] или через Claude Console для обсуждения вариантов корпоративного ценообразования.

Выставление счетов и платежи

  • Выставление счетов рассчитывается ежемесячно на основе фактического использования
  • Платежи обрабатываются в долларах США
  • Доступны варианты кредитной карты и выставления счетов
  • Отслеживание использования доступно в Claude Console

Часто задаваемые вопросы

Как рассчитывается использование токенов? Токены - это части текста, которые обрабатывают модели. В качестве приблизительной оценки 1 токен составляет примерно 4 символа или 0,75 слова на английском языке. Точное количество варьируется в зависимости от языка и типа контента. Есть ли бесплатные уровни или пробные версии? Новые пользователи получают небольшое количество бесплатных кредитов для тестирования API. Свяжитесь с отделом продаж для получения информации о расширенных пробных версиях для корпоративной оценки. Как складываются скидки? Скидки Batch API и кэширования промптов можно комбинировать. Например, использование обеих функций вместе обеспечивает значительную экономию затрат по сравнению со стандартными вызовами API. Какие способы оплаты принимаются? Мы принимаем основные кредитные карты для стандартных аккаунтов. Корпоративные клиенты могут договориться о выставлении счетов и других способах оплаты. По дополнительным вопросам о ценообразовании обращайтесь по адресу [email protected].