О ценах: разборы ниже используют исторические листовые цены Anthropic ($3 / $15 за 1M для Sonnet и т.д.) — они нужны для пропорций. Реальные тарифы Claudexia плоские: Opus и GPT — $0.50 / $0.50, Sonnet и Haiku — $0.33 / $0.33 за 1M. Фактические счета в 5–30 раз ниже сумм в примерах.
«Сколько нам будет стоить Claude?» — это первый вопрос, который задаёт техлид перед запуском фичи, и последний, который задаёт финдиректор после первого счёта. Между этими двумя моментами почти всегда не хватает одной таблицы. Этот пост и есть та самая таблица — превращённая в рабочие примеры, которые можно скопировать, адаптировать и защитить на бюджетном комитете. Мы посчитаем четыре типичные нагрузки от начала до конца: саппорт-чатбот, кодинг-агента, RAG над базой знаний и батчевую классификацию. А затем отсортируем рычаги экономии по ROI, чтобы вы понимали, какую ручку крутить первой.
Букварь по токенам
Прежде чем какие-либо цены обретут смысл, нужна стабильная модель токена в голове. Удобное правило: 1 токен ≈ 4 символа английского текста или примерно 0,75 слова. Письмо на 500 слов — это около 670 токенов. Типичный системный промпт с описанием инструментов и few-shot примерами на 8K контекста — 6 000–8 000 входных токенов. Длинный отчёт на 2 000 слов в Markdown — около 2 700 выходных токенов. Код плотнее: 1 000 строк TypeScript обычно укладываются в 4 000–6 000 токенов в зависимости от длины идентификаторов.
Это важно потому, что Claude тарифицируется за миллион токенов отдельно по входу и выходу, причём выход стоит примерно в 5 раз дороже входа на каждом тире. Нагрузка, которая кажется дешёвой по входу, может оказаться впятеро дороже, как только учтёшь ответ.
Цены 2026 за 1M токенов (ориентировочно)
Цифры ниже — это ставки, против которых мы моделируем в 2026 году.
Они совпадают с прайс-листом Anthropic, и Claudexia выставляет их 1:1
без наценки, просто через https://api.claudexia.tech/v1.
| Модель | Вход ($/1M) | Выход ($/1M) | Кэш-вход ($/1M) |
|---|---|---|---|
| Haiku 4.5 | $0.33 | $0.33 | $0.05 |
| Sonnet 4.6 | $0.33 | $0.33 | $0.05 |
| Opus 4.7 | $0.50 | $0.50 | $0.05 |
Запомните две вещи: кэшированный вход в 10 раз дешевле обычного, а Batch API даёт скидку 50% на вход и выход для задач, которые можно подождать до 24 часов. Эти два механизма обеспечивают большую часть оптимизаций, описанных ниже.
Пример 1: саппорт-чатбот
Нагрузка: 10 000 диалогов в месяц. В среднем 8 000 входных токенов на запрос (системный промпт + инструменты + контекст + история) и 800 выходных токенов в ответе. Один ход для простоты.
На Sonnet 4.6 без кэширования:
- Вход: 10 000 × 8 000 = 80M токенов × $3.00 = $240
- Выход: 10 000 × 800 = 8M токенов × $15.00 = $120
- Итого в месяц: $360
Теперь включаем кэширование стабильных 6 000 токенов системного промпта, оставляя 2 000 токенов динамики на вызов:
- Кэш-вход: 10 000 × 6 000 = 60M × $0.30 = $18
- Свежий вход: 10 000 × 2 000 = 20M × $3.00 = $60
- Выход: без изменений — $120
- Итого: $198 — экономия 45%.
Цена за диалог падает с $0.036 до $0.020. На 100 000 диалогов в месяц эта дельта — это $1 800 экономии каждый месяц с одного флага в конфиге.
Пример 2: кодинг-агент
Нагрузка: 200 PR в день, каждый запускает агентский цикл с ~30 000 входных токенов (контекст репо, диффы, история tool calls) и 5 000 выходных токенов (патчи, объяснения, тесты). На Sonnet 4.6.
Дневная математика:
- Вход: 200 × 30 000 = 6M × $3.00 = $18
- Выход: 200 × 5 000 = 1M × $15.00 = $15
- Итого в день: $33 → примерно $990/мес
Кодинг-агенты — место, где Opus отрабатывает свой ценник. Если 20% PR эскалируются на Opus для сложных задач:
- 80% Sonnet: $26.40/день
- 20% Opus: 40 × (30K × $15/1M + 5K × $75/1M) = 40 × $0.825 = $33/день
- Смешанный итог: ~$59/день → примерно $1 770/мес
Кэширование 20K токенов стабильной части контекста репо снова режет вход вдвое. Большинство команд приходят к $1 100–$1 300/мес после кэширования.
Пример 3: RAG над базой знаний 10M токенов
Нагрузка: 1 000 запросов в день. Каждый запрос вытаскивает top-K чанков общим объёмом ~5 000 токенов плюс системный промпт 1 500 токенов и генерирует ответ на 600 токенов на Sonnet 4.6.
Дневная математика:
- Вход: 1 000 × 6 500 = 6.5M × $3.00 = $19.50
- Выход: 1 000 × 600 = 0.6M × $15.00 = $9.00
- Итого в день: $28.50 → примерно $855/мес
Интересный вопрос — стоит ли запихнуть всю базу 10M токенов в контекст с кэшированием вместо ретривера. Кэш на 10M стоит $3 000 за запись один раз, а потом $300/день за чтение по $0.30/1M. Эта математика выигрывает только при 30 000+ запросов/день — ниже этой планки ретривер с генерацией остаётся дешевле.
Пример 4: батчевая классификация
Нагрузка: 1 000 000 записей. По 500 входных токенов и 50 токенов JSON-метки на запись. На Haiku через Batch API.
Без батчинга:
- Вход: 1M × 500 = 500M × $0.25 = $125
- Выход: 1M × 50 = 50M × $1.25 = $62.50
- Итого: $187.50
С Batch API (скидка 50%):
- Вход: 500M × $0.125 = $62.50
- Выход: 50M × $0.625 = $31.25
- Итого: $93.75 — ровно вдвое дешевле.
Для бэкфиллов, прогонов модерации и ночных задач разметки Batch API — самый мощный рычаг без единой строки кода.
Рычаги экономии по ROI
После прогона этих четырёх сценариев с десятками команд на Claudexia порядок рычагов одинаковый:
- Ограничьте выход. Выход стоит 5× входа. Лимит
max_tokensплюс инструкция «будь краток» — самое выгодное изменение, обычно 30–50% экономии без потери качества. - Кэшируйте стабильный системный промпт. Описания инструментов, роли, few-shot примеры почти не меняются. Кэш режет вход на 90% в этой части.
- Перенесите асинхронную работу в Batch API. Плоские 50% скидки на вход и выход для задач с SLA до 24 часов.
- Маршрутизируйте сначала на Haiku. Классификация, роутинг, экстракция и гейты «а это вообще стоит эскалации?» — для Haiku. Sonnet — для рассуждений, Opus — для жёстких 5%.
- Сжимайте контекст. Уменьшайте top-K, суммаризируйте длинные чанки, обрезайте историю. Каждые 1 000 входных токенов экономии на вызов умножаются на миллионы вызовов.
Цена за вызов и за активного пользователя
Две таблички, которые стоит держать в роадмапе.
Цена за вызов (Sonnet 4.6, с кэшем, 600 выходных токенов):
| Входных токенов | Цена за вызов |
|---|---|
| 2 000 | $0.012 |
| 5 000 | $0.018 |
| 10 000 | $0.027 |
| 20 000 | $0.045 |
Цена на месячного активного пользователя (чатбот, Sonnet 4.6, с кэшем):
| Вызовов/MAU/мес | Цена за MAU |
|---|---|
| 5 | $0.10 |
| 20 | $0.40 |
| 100 | $2.00 |
| 500 | $10.00 |
Эти две таблицы позволяют провести прямую линию от продуктовых метрик (MAU, вызовов на пользователя) до защитимой строки расходов в прогнозе.
Где здесь Claudexia
Claudexia выставляет цены Anthropic 1:1 — ставки выше это и есть то,
что вы платите. Дашборд показывает фактическое потребление по моделям,
по ключам и по диалогам, так что в момент релиза фичи вы видите,
сходятся ли реальные цифры с таблицей, которую вы собрали по этому
посту. Когда не сходятся — рычаги выше обычно дают ответ. Направьте
SDK на https://api.claudexia.tech/v1, и тот же код, что был написан
под Anthropic, продолжит работать — включая заголовки кэширования и
Batch API.