Перейти к содержимому

Лучшие практики

Следуйте этим рекомендациям для оптимизации стоимости, производительности и надёжности при работе с Claudexia API.

Выбирайте подходящую модель

Подбирайте модель под сложность задачи:

ЗадачаРекомендуемая модель
Сложные рассуждения, исследованияclaude-opus-4.5
Общее программирование, повседневные задачиclaude-sonnet-4.5
Быстрые ответы, классификацияclaude-haiku-4.5

Использование меньшей модели для простых задач значительно снижает стоимость и задержку.

Используйте кэширование промптов

Если вы отправляете одинаковый системный промпт в нескольких запросах, используйте кэширование для снижения стоимости входных токенов.

Добавьте cache_control в блок системного сообщения:

json
{
  "system": [
    {
      "type": "text",
      "text": "You are a helpful coding assistant...",
      "cache_control": { "type": "ephemeral" }
    }
  ]
}

Устанавливайте подходящий max_tokens

Устанавливайте max_tokens на минимально необходимое значение:

  • Короткие ответы: 256–512
  • Генерация кода: 2048–4096
  • Длинный контент: 4096–8192

Меньшие значения снижают стоимость и могут уменьшить задержку.

Используйте стриминг для ответов в реальном времени

Включите стриминг для получения токенов по мере генерации, что улучшает воспринимаемую задержку:

bash
curl https://api.claudexia.tech/v1/messages \
  -H "Content-Type: application/json" \
  -H "x-api-key: sk_cdx_YOUR_KEY" \
  -H "anthropic-version: 2023-06-01" \
  -d '{
    "model": "claude-sonnet-4.5",
    "max_tokens": 1024,
    "stream": true,
    "messages": [
      {"role": "user", "content": "Hello!"}
    ]
  }'

Разделяйте ключи по окружениям

Создавайте отдельные ключи для каждого окружения для изоляции использования и упрощения отладки:

  • Production — основной ключ приложения со строгими лимитами
  • Development — мягкие лимиты для тестирования
  • CI/CD — выделенный ключ для автотестов

Это упрощает отслеживание расходов, ротацию ключей и отзыв доступа по окружениям.

Отслеживайте использование и настройте оповещения

Используйте панель аналитики для отслеживания:

  • Потребление токенов по ключам и моделям
  • Тренды расходов
  • Срабатывания лимитов
  • Неожиданные всплески использования

Настройте оповещения о низком балансе в Настройках, чтобы получать уведомления до исчерпания средств.