Перейти к содержимому
ТАРИФЫ

Сколько стоит Claude API в 2026: калькулятор цены для реальной нагрузки

Считаем стоимость Claude API без иллюзий: чатбот, RAG, кодинг-агент и классификация. Формулы, кэширование, batch и как уменьшить счёт.

О ценах: разборы ниже используют исторические листовые цены Anthropic ($3 / $15 за 1M для Sonnet и т.д.) — они нужны для пропорций. Реальные тарифы Claudexia плоские: Opus и GPT — $0.50 / $0.50, Sonnet и Haiku — $0.33 / $0.33 за 1M. Фактические счета в 5–30 раз ниже сумм в примерах.

«Сколько нам будет стоить Claude?» — это первый вопрос, который задаёт техлид перед запуском фичи, и последний, который задаёт финдиректор после первого счёта. Между этими двумя моментами почти всегда не хватает одной таблицы. Этот пост и есть та самая таблица — превращённая в рабочие примеры, которые можно скопировать, адаптировать и защитить на бюджетном комитете. Мы посчитаем четыре типичные нагрузки от начала до конца: саппорт-чатбот, кодинг-агента, RAG над базой знаний и батчевую классификацию. А затем отсортируем рычаги экономии по ROI, чтобы вы понимали, какую ручку крутить первой.

Букварь по токенам

Прежде чем какие-либо цены обретут смысл, нужна стабильная модель токена в голове. Удобное правило: 1 токен ≈ 4 символа английского текста или примерно 0,75 слова. Письмо на 500 слов — это около 670 токенов. Типичный системный промпт с описанием инструментов и few-shot примерами на 8K контекста — 6 000–8 000 входных токенов. Длинный отчёт на 2 000 слов в Markdown — около 2 700 выходных токенов. Код плотнее: 1 000 строк TypeScript обычно укладываются в 4 000–6 000 токенов в зависимости от длины идентификаторов.

Это важно потому, что Claude тарифицируется за миллион токенов отдельно по входу и выходу, причём выход стоит примерно в 5 раз дороже входа на каждом тире. Нагрузка, которая кажется дешёвой по входу, может оказаться впятеро дороже, как только учтёшь ответ.

Цены 2026 за 1M токенов (ориентировочно)

Цифры ниже — это ставки, против которых мы моделируем в 2026 году. Они совпадают с прайс-листом Anthropic, и Claudexia выставляет их 1:1 без наценки, просто через https://api.claudexia.tech/v1.

МодельВход ($/1M)Выход ($/1M)Кэш-вход ($/1M)
Haiku 4.5$0.33$0.33$0.05
Sonnet 4.6$0.33$0.33$0.05
Opus 4.7$0.50$0.50$0.05

Запомните две вещи: кэшированный вход в 10 раз дешевле обычного, а Batch API даёт скидку 50% на вход и выход для задач, которые можно подождать до 24 часов. Эти два механизма обеспечивают большую часть оптимизаций, описанных ниже.

Пример 1: саппорт-чатбот

Нагрузка: 10 000 диалогов в месяц. В среднем 8 000 входных токенов на запрос (системный промпт + инструменты + контекст + история) и 800 выходных токенов в ответе. Один ход для простоты.

На Sonnet 4.6 без кэширования:

  • Вход: 10 000 × 8 000 = 80M токенов × $3.00 = $240
  • Выход: 10 000 × 800 = 8M токенов × $15.00 = $120
  • Итого в месяц: $360

Теперь включаем кэширование стабильных 6 000 токенов системного промпта, оставляя 2 000 токенов динамики на вызов:

  • Кэш-вход: 10 000 × 6 000 = 60M × $0.30 = $18
  • Свежий вход: 10 000 × 2 000 = 20M × $3.00 = $60
  • Выход: без изменений — $120
  • Итого: $198 — экономия 45%.

Цена за диалог падает с $0.036 до $0.020. На 100 000 диалогов в месяц эта дельта — это $1 800 экономии каждый месяц с одного флага в конфиге.

Пример 2: кодинг-агент

Нагрузка: 200 PR в день, каждый запускает агентский цикл с ~30 000 входных токенов (контекст репо, диффы, история tool calls) и 5 000 выходных токенов (патчи, объяснения, тесты). На Sonnet 4.6.

Дневная математика:

  • Вход: 200 × 30 000 = 6M × $3.00 = $18
  • Выход: 200 × 5 000 = 1M × $15.00 = $15
  • Итого в день: $33 → примерно $990/мес

Кодинг-агенты — место, где Opus отрабатывает свой ценник. Если 20% PR эскалируются на Opus для сложных задач:

  • 80% Sonnet: $26.40/день
  • 20% Opus: 40 × (30K × $15/1M + 5K × $75/1M) = 40 × $0.825 = $33/день
  • Смешанный итог: ~$59/день → примерно $1 770/мес

Кэширование 20K токенов стабильной части контекста репо снова режет вход вдвое. Большинство команд приходят к $1 100–$1 300/мес после кэширования.

Пример 3: RAG над базой знаний 10M токенов

Нагрузка: 1 000 запросов в день. Каждый запрос вытаскивает top-K чанков общим объёмом ~5 000 токенов плюс системный промпт 1 500 токенов и генерирует ответ на 600 токенов на Sonnet 4.6.

Дневная математика:

  • Вход: 1 000 × 6 500 = 6.5M × $3.00 = $19.50
  • Выход: 1 000 × 600 = 0.6M × $15.00 = $9.00
  • Итого в день: $28.50 → примерно $855/мес

Интересный вопрос — стоит ли запихнуть всю базу 10M токенов в контекст с кэшированием вместо ретривера. Кэш на 10M стоит $3 000 за запись один раз, а потом $300/день за чтение по $0.30/1M. Эта математика выигрывает только при 30 000+ запросов/день — ниже этой планки ретривер с генерацией остаётся дешевле.

Пример 4: батчевая классификация

Нагрузка: 1 000 000 записей. По 500 входных токенов и 50 токенов JSON-метки на запись. На Haiku через Batch API.

Без батчинга:

  • Вход: 1M × 500 = 500M × $0.25 = $125
  • Выход: 1M × 50 = 50M × $1.25 = $62.50
  • Итого: $187.50

С Batch API (скидка 50%):

  • Вход: 500M × $0.125 = $62.50
  • Выход: 50M × $0.625 = $31.25
  • Итого: $93.75 — ровно вдвое дешевле.

Для бэкфиллов, прогонов модерации и ночных задач разметки Batch API — самый мощный рычаг без единой строки кода.

Рычаги экономии по ROI

После прогона этих четырёх сценариев с десятками команд на Claudexia порядок рычагов одинаковый:

  1. Ограничьте выход. Выход стоит 5× входа. Лимит max_tokens плюс инструкция «будь краток» — самое выгодное изменение, обычно 30–50% экономии без потери качества.
  2. Кэшируйте стабильный системный промпт. Описания инструментов, роли, few-shot примеры почти не меняются. Кэш режет вход на 90% в этой части.
  3. Перенесите асинхронную работу в Batch API. Плоские 50% скидки на вход и выход для задач с SLA до 24 часов.
  4. Маршрутизируйте сначала на Haiku. Классификация, роутинг, экстракция и гейты «а это вообще стоит эскалации?» — для Haiku. Sonnet — для рассуждений, Opus — для жёстких 5%.
  5. Сжимайте контекст. Уменьшайте top-K, суммаризируйте длинные чанки, обрезайте историю. Каждые 1 000 входных токенов экономии на вызов умножаются на миллионы вызовов.

Цена за вызов и за активного пользователя

Две таблички, которые стоит держать в роадмапе.

Цена за вызов (Sonnet 4.6, с кэшем, 600 выходных токенов):

Входных токеновЦена за вызов
2 000$0.012
5 000$0.018
10 000$0.027
20 000$0.045

Цена на месячного активного пользователя (чатбот, Sonnet 4.6, с кэшем):

Вызовов/MAU/месЦена за MAU
5$0.10
20$0.40
100$2.00
500$10.00

Эти две таблицы позволяют провести прямую линию от продуктовых метрик (MAU, вызовов на пользователя) до защитимой строки расходов в прогнозе.

Где здесь Claudexia

Claudexia выставляет цены Anthropic 1:1 — ставки выше это и есть то, что вы платите. Дашборд показывает фактическое потребление по моделям, по ключам и по диалогам, так что в момент релиза фичи вы видите, сходятся ли реальные цифры с таблицей, которую вы собрали по этому посту. Когда не сходятся — рычаги выше обычно дают ответ. Направьте SDK на https://api.claudexia.tech/v1, и тот же код, что был написан под Anthropic, продолжит работать — включая заголовки кэширования и Batch API.