Лучшие практики
Следуйте этим рекомендациям для оптимизации стоимости, производительности и надёжности при работе с Claudexia API.
Выбирайте подходящую модель
Подбирайте модель под сложность задачи:
| Задача | Рекомендуемая модель |
|---|---|
| Сложные рассуждения, исследования | claude-opus-4.5 |
| Общее программирование, повседневные задачи | claude-sonnet-4.5 |
| Быстрые ответы, классификация | claude-haiku-4.5 |
Использование меньшей модели для простых задач значительно снижает стоимость и задержку.
Используйте кэширование промптов
Если вы отправляете одинаковый системный промпт в нескольких запросах, используйте кэширование для снижения стоимости входных токенов.
Добавьте cache_control в блок системного сообщения:
{
"system": [
{
"type": "text",
"text": "You are a helpful coding assistant...",
"cache_control": { "type": "ephemeral" }
}
]
}Устанавливайте подходящий max_tokens
Устанавливайте max_tokens на минимально необходимое значение:
- Короткие ответы: 256–512
- Генерация кода: 2048–4096
- Длинный контент: 4096–8192
Меньшие значения снижают стоимость и могут уменьшить задержку.
Используйте стриминг для ответов в реальном времени
Включите стриминг для получения токенов по мере генерации, что улучшает воспринимаемую задержку:
curl https://api.claudexia.tech/v1/messages \
-H "Content-Type: application/json" \
-H "x-api-key: sk_cdx_YOUR_KEY" \
-H "anthropic-version: 2023-06-01" \
-d '{
"model": "claude-sonnet-4.5",
"max_tokens": 1024,
"stream": true,
"messages": [
{"role": "user", "content": "Hello!"}
]
}'Разделяйте ключи по окружениям
Создавайте отдельные ключи для каждого окружения для изоляции использования и упрощения отладки:
- Production — основной ключ приложения со строгими лимитами
- Development — мягкие лимиты для тестирования
- CI/CD — выделенный ключ для автотестов
Это упрощает отслеживание расходов, ротацию ключей и отзыв доступа по окружениям.
Отслеживайте использование и настройте оповещения
Используйте панель аналитики для отслеживания:
- Потребление токенов по ключам и моделям
- Тренды расходов
- Срабатывания лимитов
- Неожиданные всплески использования
Настройте оповещения о низком балансе в Настройках, чтобы получать уведомления до исчерпания средств.