Модели и API Claude Code: Sonnet, Opus, Haiku

6 минут чтения · 5 просмотров
Алексей Воронов
Алексей Воронов AI-инструменты · Koderra
Тестирует и описывает современные инструменты для разработчиков. Специализация — AI-ассистенты, автоматизация и CLI-инструменты.
17 апреля 2026
Abstract illustration depicting complex digital neural networks and data flow.
Claude Code · Модели и API

Claude Code работает на моделях Anthropic семейства Claude 4. По умолчанию — Claude Sonnet 4.6. Opus доступен в подписках Max. Модель можно менять на лету.

Доступные модели

AI Lovers
Эксперт по Claude Code
Claude Code под ваш проект: премиальная настройка, MCP и безопасная интеграция
от 14 990 ₽ →
Модель Когда доступна Лучше для
Claude Sonnet 4.6 Pro, Max, API Большинство задач: баланс скорости и качества
Claude Opus 4.6 Max 5x, Max 20x, API Сложная архитектура, глубокий рефакторинг, нестандартные задачи
Claude Haiku 4.5 API Быстрые, простые задачи, где важна скорость

Контекстное окно: 1 миллион токенов

С марта 2026 контекстное окно в 1M токенов стало бесплатным для Sonnet 4.6 и Opus 4.6 — без доплаты. Это ~750 000 слов: целая крупная кодовая база в памяти одновременно.

✅ Что это значит на практике: Claude Code может держать в контексте весь монорепозиторий, все тесты и документацию одновременно — без потери контекста при больших задачах.

Смена модели

# В командной строке
claude --model claude-opus-4-6

# Внутри сессии
/model claude-sonnet-4-6

# Проверить текущую модель
/status

API Anthropic

Если предпочитаете pay-as-you-go или хотите интегрировать Claude в свои приложения:

# Получить API-ключ: console.anthropic.com

# Использование в Claude Code
export ANTHROPIC_API_KEY=sk-ant-api03-...
claude

# Проверка ключа
curl https://api.anthropic.com/v1/messages \
  -H "x-api-key: $ANTHROPIC_API_KEY" \
  -H "anthropic-version: 2023-06-01" \
  -H "content-type: application/json" \
  -d '{"model":"claude-sonnet-4-6","max_tokens":10,"messages":[{"role":"user","content":"ping"}]}'

Цены API (за 1M токенов)

МодельInputOutputCache writeCache read
Sonnet 4.6$3$15$3.75$0.30
Opus 4.6$15$75$18.75$1.50
Haiku 4.5$0.80$4$1.00$0.08

Prompt caching снижает стоимость повторяющихся системных промптов и CLAUDE.md — при активных сессиях экономия 60–90% на кешированных входных токенах.

Производительность моделей

  • Opus 4.6 — SOTA на Terminal-Bench 2.0 (агентное кодирование), контекст 1M токенов, score 78.3% на MRCR v2
  • Sonnet 4.6 — быстрее Opus, отличное соотношение цена/качество, подходит для 95% задач
  • Haiku 4.5 — самый быстрый, для массовых простых операций

OAuth vs API Key

OAuth (браузер)API Key
Как получитьclaude.ai аккаунтconsole.anthropic.com
ТарификацияПо подписке (Pro/Max)Pay-as-you-go по токенам
Удалённый серверСложно (нужен браузер)Просто (env variable)
CI/CD

Claude Code — главная · → Лимиты и usage · → Интеграции

Актуальные цены API (2026)

МодельInput (до 200K)Input (>200K)Output
Claude Opus 4.6$5 / MTok$10 / MTok$25 / MTok
Claude Sonnet 4.6$3 / MTok$6 / MTok$15 / MTok
Claude Haiku 4.5$1 / MTok$5 / MTok

MTok = миллион токенов. При запросах длиннее 200K токенов (например, загрузка большой кодовой базы) цена входных токенов удваивается — учитывайте это при работе с монорепозиториями.

Prompt Caching — экономия до 90%

Самая важная оптимизация при работе через API. Если один и тот же системный промпт или контекст файлов отправляется в нескольких запросах, Anthropic кэширует его:

ОперацияSonnet 4.6Opus 4.6
Запись кэша (cache write)$3.75 / MTok$6.25 / MTok
Чтение кэша (cache hit)$0.30 / MTok$1.50 / MTok

Один разработчик подсчитал: 4,5 миллиарда токенов кэш-чтений обошлись в $6 750 вместо $67 500 без кэша. Экономия 10×.

Batch API — минус 50% при несрочных задачах

Для задач, которые не требуют мгновенного ответа (рефакторинг, генерация документации, тестов), используйте Batch API:

# Batch API обрабатывает запросы в течение 24 часов
# Стоимость: 50% от стандартной цены
# Sonnet 4.6 batch: $1.50 input / $7.50 output (вместо $3/$15)

Когда Max-подписка выгоднее API

Реальный расчёт от разработчика, отслеживавшего использование 8 месяцев:

СценарийСтоимость APIСтоимость MaxЭкономия
Лёгкое использование (<50M токенов/мес)<$100$100–200API выгоднее
Среднее (50–200M токенов/мес)$100–400$100Max 5× экономит до 4×
Активное (200M–1B токенов/мес)$400–2 000$100–200Max экономит сотни $
Интенсивное (1B+ токенов/мес)$2 000+$200Max экономит тысячи $
Вывод: При полном ежедневном использовании Claude Code Max 20× обходится примерно в 18 раз дешевле прямого API. Если вы разработчик, использующий Claude как основной инструмент — подписка окупается.

Три модели — три роли: как реально их использовать

Распространённое заблуждение: Opus — самый умный, Haiku — самый тупой, Sonnet — посередине. Поэтому "нужно всегда выбирать Opus". На самом деле у каждой модели есть своя ниша, и правильный выбор сэкономит и деньги, и время.

OPUS 4.6 — Глубокое мышление

Существует для задач, которые Sonnet решает неверно: нестандартные алгоритмы, архитектурные решения с десятками ограничений, рефакторинг тесно связанных систем.

Только в Max 5x / Max 20x
SONNET 4.6 — Рабочая лошадь

Дефолтная модель, правильный выбор для 90% задач. Сильное рассуждение, быстрый ответ, хватает для большинства рефакторингов, написания тестов, анализа кода.

Pro, Max, API
HAIKU 4.5 — Скорость и объём

В 3 раза быстрее Sonnet, в 3,75 раза дешевле. Справляется с классификацией, форматированием, простыми правками, роутингом. Идеален для массовых задач.

API / внутри сессии через /model

Модельная стратегия от опытных разработчиков

По наблюдению сообщества, самые продуктивные разработчики не "выбирают одну модель" — они используют все три в одном рабочем процессе:

  • Haiku — для быстрых вопросов, объяснений синтаксиса, мелких правок. Не тратить Sonnet на "что значит эта конструкция?"
  • Sonnet — основная рабочая модель. Написание функций, тестов, рефакторинг, анализ. Дефолт для всего что требует думать.
  • Opus — перед серьёзным PR или архитектурным решением. "Проверь весь этот код, найди неочевидные ошибки, оцени решение".
«Haiku как роутер: сортирует запросы, простые обрабатывает сам. Sonnet — основная разработка. Opus — как старший ревьюер перед релизом. Это не про экономию токенов, это про правильный инструмент для каждой задачи.»
— паттерн из описания production-систем 2026

Когда Sonnet лучше Opus

Это важный контрпункт: Opus не всегда лучше. Есть ситуации, где Sonnet даёт лучший результат:

  • Быстрые итерации — Opus думает дольше. Когда вы в потоке и делаете 20 маленьких задач подряд, Sonnet не тормозит рабочий процесс.
  • Простые задачи — Opus на простом запросе иногда "переусложняет" ответ, добавляя излишние оговорки.
  • Задачи по шаблону — написать 50 тестов по образцу, сгенерировать CRUD по схеме. Sonnet справится так же хорошо.
  • Токены и бюджет — Opus потребляет лимит в 5 раз быстрее Sonnet. На Max 20x это важно при интенсивной работе.

Extended Thinking: когда включать

Extended Thinking — режим где модель явно "думает вслух" перед ответом, тратя дополнительные токены на обдумывание. Активируется через ключевые слова:

Слово в запросеГлубина размышленийКогда использовать
think~5 000 токеновНетривиальный баг, сложный рефакторинг
think harder~10 000 токеновАрхитектурные решения, дизайн API
ultrathinkдо 31 999 токеновСамые сложные задачи, полный анализ системы

Реальный случай применения: разработчик несколько дней не мог найти race condition в асинхронном коде. Написал: ultrathink: почему этот код иногда возвращает nil при конкурентных запросах? — Claude за одну сессию нашёл тонкую ошибку синхронизации, которую человек пропустил при нескольких ревью.

Prompt Caching: скрытая оптимизация

При работе через API есть механизм, который мало кто использует осознанно, хотя он встроен в Claude Code: prompt caching. Если в нескольких последовательных запросах первая часть промпта одинакова (например, системный промпт или содержимое CLAUDE.md), Anthropic кэширует её.

Один разработчик, отслеживавший расходы API, обнаружил: из 4,5 миллиарда токенов за год — 4 миллиарда пришлись на кэш-чтения по цене $0.30/MTok вместо $3/MTok. Экономия 10× только за счёт кэширования.

Для Claude Code это работает автоматически — CLAUDE.md кэшируется между запросами одной сессии. При работе через API можно управлять этим явно через параметр cache_control.

AI Lovers
AI Lovers ✓ Проверен
Помогаю командам разработчиков запускать AI-инструменты на собственных серверах. Специализация — Claude Code, Docker-стеки для LLM-агентов, MCP-серверы. Работаю
Услуги эксперта по теме