Модели и API Claude Code: Sonnet, Opus, Haiku
Claude Code работает на моделях Anthropic семейства Claude 4. По умолчанию — Claude Sonnet 4.6. Opus доступен в подписках Max. Модель можно менять на лету.
Доступные модели
| Модель | Когда доступна | Лучше для |
|---|---|---|
| Claude Sonnet 4.6 | Pro, Max, API | Большинство задач: баланс скорости и качества |
| Claude Opus 4.6 | Max 5x, Max 20x, API | Сложная архитектура, глубокий рефакторинг, нестандартные задачи |
| Claude Haiku 4.5 | API | Быстрые, простые задачи, где важна скорость |
Контекстное окно: 1 миллион токенов
С марта 2026 контекстное окно в 1M токенов стало бесплатным для Sonnet 4.6 и Opus 4.6 — без доплаты. Это ~750 000 слов: целая крупная кодовая база в памяти одновременно.
Смена модели
# В командной строке
claude --model claude-opus-4-6
# Внутри сессии
/model claude-sonnet-4-6
# Проверить текущую модель
/status
API Anthropic
Если предпочитаете pay-as-you-go или хотите интегрировать Claude в свои приложения:
# Получить API-ключ: console.anthropic.com
# Использование в Claude Code
export ANTHROPIC_API_KEY=sk-ant-api03-...
claude
# Проверка ключа
curl https://api.anthropic.com/v1/messages \
-H "x-api-key: $ANTHROPIC_API_KEY" \
-H "anthropic-version: 2023-06-01" \
-H "content-type: application/json" \
-d '{"model":"claude-sonnet-4-6","max_tokens":10,"messages":[{"role":"user","content":"ping"}]}'
Цены API (за 1M токенов)
| Модель | Input | Output | Cache write | Cache read |
|---|---|---|---|---|
| Sonnet 4.6 | $3 | $15 | $3.75 | $0.30 |
| Opus 4.6 | $15 | $75 | $18.75 | $1.50 |
| Haiku 4.5 | $0.80 | $4 | $1.00 | $0.08 |
Prompt caching снижает стоимость повторяющихся системных промптов и CLAUDE.md — при активных сессиях экономия 60–90% на кешированных входных токенах.
Производительность моделей
- Opus 4.6 — SOTA на Terminal-Bench 2.0 (агентное кодирование), контекст 1M токенов, score 78.3% на MRCR v2
- Sonnet 4.6 — быстрее Opus, отличное соотношение цена/качество, подходит для 95% задач
- Haiku 4.5 — самый быстрый, для массовых простых операций
OAuth vs API Key
| OAuth (браузер) | API Key | |
|---|---|---|
| Как получить | claude.ai аккаунт | console.anthropic.com |
| Тарификация | По подписке (Pro/Max) | Pay-as-you-go по токенам |
| Удалённый сервер | Сложно (нужен браузер) | Просто (env variable) |
| CI/CD | ❌ | ✅ |
← Claude Code — главная · → Лимиты и usage · → Интеграции
Актуальные цены API (2026)
| Модель | Input (до 200K) | Input (>200K) | Output |
|---|---|---|---|
| Claude Opus 4.6 | $5 / MTok | $10 / MTok | $25 / MTok |
| Claude Sonnet 4.6 | $3 / MTok | $6 / MTok | $15 / MTok |
| Claude Haiku 4.5 | $1 / MTok | — | $5 / MTok |
MTok = миллион токенов. При запросах длиннее 200K токенов (например, загрузка большой кодовой базы) цена входных токенов удваивается — учитывайте это при работе с монорепозиториями.
Prompt Caching — экономия до 90%
Самая важная оптимизация при работе через API. Если один и тот же системный промпт или контекст файлов отправляется в нескольких запросах, Anthropic кэширует его:
| Операция | Sonnet 4.6 | Opus 4.6 |
|---|---|---|
| Запись кэша (cache write) | $3.75 / MTok | $6.25 / MTok |
| Чтение кэша (cache hit) | $0.30 / MTok | $1.50 / MTok |
Один разработчик подсчитал: 4,5 миллиарда токенов кэш-чтений обошлись в $6 750 вместо $67 500 без кэша. Экономия 10×.
Batch API — минус 50% при несрочных задачах
Для задач, которые не требуют мгновенного ответа (рефакторинг, генерация документации, тестов), используйте Batch API:
# Batch API обрабатывает запросы в течение 24 часов
# Стоимость: 50% от стандартной цены
# Sonnet 4.6 batch: $1.50 input / $7.50 output (вместо $3/$15)
Когда Max-подписка выгоднее API
Реальный расчёт от разработчика, отслеживавшего использование 8 месяцев:
| Сценарий | Стоимость API | Стоимость Max | Экономия |
|---|---|---|---|
| Лёгкое использование (<50M токенов/мес) | <$100 | $100–200 | API выгоднее |
| Среднее (50–200M токенов/мес) | $100–400 | $100 | Max 5× экономит до 4× |
| Активное (200M–1B токенов/мес) | $400–2 000 | $100–200 | Max экономит сотни $ |
| Интенсивное (1B+ токенов/мес) | $2 000+ | $200 | Max экономит тысячи $ |
Три модели — три роли: как реально их использовать
Распространённое заблуждение: Opus — самый умный, Haiku — самый тупой, Sonnet — посередине. Поэтому "нужно всегда выбирать Opus". На самом деле у каждой модели есть своя ниша, и правильный выбор сэкономит и деньги, и время.
Существует для задач, которые Sonnet решает неверно: нестандартные алгоритмы, архитектурные решения с десятками ограничений, рефакторинг тесно связанных систем.
Дефолтная модель, правильный выбор для 90% задач. Сильное рассуждение, быстрый ответ, хватает для большинства рефакторингов, написания тестов, анализа кода.
В 3 раза быстрее Sonnet, в 3,75 раза дешевле. Справляется с классификацией, форматированием, простыми правками, роутингом. Идеален для массовых задач.
Модельная стратегия от опытных разработчиков
По наблюдению сообщества, самые продуктивные разработчики не "выбирают одну модель" — они используют все три в одном рабочем процессе:
- Haiku — для быстрых вопросов, объяснений синтаксиса, мелких правок. Не тратить Sonnet на "что значит эта конструкция?"
- Sonnet — основная рабочая модель. Написание функций, тестов, рефакторинг, анализ. Дефолт для всего что требует думать.
- Opus — перед серьёзным PR или архитектурным решением. "Проверь весь этот код, найди неочевидные ошибки, оцени решение".
«Haiku как роутер: сортирует запросы, простые обрабатывает сам. Sonnet — основная разработка. Opus — как старший ревьюер перед релизом. Это не про экономию токенов, это про правильный инструмент для каждой задачи.»
— паттерн из описания production-систем 2026
Когда Sonnet лучше Opus
Это важный контрпункт: Opus не всегда лучше. Есть ситуации, где Sonnet даёт лучший результат:
- Быстрые итерации — Opus думает дольше. Когда вы в потоке и делаете 20 маленьких задач подряд, Sonnet не тормозит рабочий процесс.
- Простые задачи — Opus на простом запросе иногда "переусложняет" ответ, добавляя излишние оговорки.
- Задачи по шаблону — написать 50 тестов по образцу, сгенерировать CRUD по схеме. Sonnet справится так же хорошо.
- Токены и бюджет — Opus потребляет лимит в 5 раз быстрее Sonnet. На Max 20x это важно при интенсивной работе.
Extended Thinking: когда включать
Extended Thinking — режим где модель явно "думает вслух" перед ответом, тратя дополнительные токены на обдумывание. Активируется через ключевые слова:
| Слово в запросе | Глубина размышлений | Когда использовать |
|---|---|---|
think | ~5 000 токенов | Нетривиальный баг, сложный рефакторинг |
think harder | ~10 000 токенов | Архитектурные решения, дизайн API |
ultrathink | до 31 999 токенов | Самые сложные задачи, полный анализ системы |
Реальный случай применения: разработчик несколько дней не мог найти race condition в асинхронном коде. Написал: ultrathink: почему этот код иногда возвращает nil при конкурентных запросах? — Claude за одну сессию нашёл тонкую ошибку синхронизации, которую человек пропустил при нескольких ревью.
Prompt Caching: скрытая оптимизация
При работе через API есть механизм, который мало кто использует осознанно, хотя он встроен в Claude Code: prompt caching. Если в нескольких последовательных запросах первая часть промпта одинакова (например, системный промпт или содержимое CLAUDE.md), Anthropic кэширует её.
Один разработчик, отслеживавший расходы API, обнаружил: из 4,5 миллиарда токенов за год — 4 миллиарда пришлись на кэш-чтения по цене $0.30/MTok вместо $3/MTok. Экономия 10× только за счёт кэширования.
Для Claude Code это работает автоматически — CLAUDE.md кэшируется между запросами одной сессии. При работе через API можно управлять этим явно через параметр cache_control.