Модели и API Claude Code: Sonnet, Opus, Haiku

6 минут чтения · 5 просмотров

Алексей Воронов AI-инструменты · Koderra

Тестирует и описывает современные инструменты для разработчиков. Специализация — AI-ассистенты, автоматизация и CLI-инструменты.

17 апреля 2026

Abstract illustration depicting complex digital neural networks and data flow. — Claude Code · Модели и API

Claude Code работает на моделях Anthropic семейства Claude 4. По умолчанию — Claude Sonnet 4.6. Opus доступен в подписках Max. Модель можно менять на лету.

Доступные модели

Модель	Когда доступна	Лучше для
Claude Sonnet 4.6	Pro, Max, API	Большинство задач: баланс скорости и качества
Claude Opus 4.6	Max 5x, Max 20x, API	Сложная архитектура, глубокий рефакторинг, нестандартные задачи
Claude Haiku 4.5	API	Быстрые, простые задачи, где важна скорость

Контекстное окно: 1 миллион токенов

С марта 2026 контекстное окно в 1M токенов стало бесплатным для Sonnet 4.6 и Opus 4.6 — без доплаты. Это ~750 000 слов: целая крупная кодовая база в памяти одновременно.

✅ Что это значит на практике: Claude Code может держать в контексте весь монорепозиторий, все тесты и документацию одновременно — без потери контекста при больших задачах.

Смена модели

# В командной строке
claude --model claude-opus-4-6

# Внутри сессии
/model claude-sonnet-4-6

# Проверить текущую модель
/status

API Anthropic

Если предпочитаете pay-as-you-go или хотите интегрировать Claude в свои приложения:

# Получить API-ключ: console.anthropic.com

# Использование в Claude Code
export ANTHROPIC_API_KEY=sk-ant-api03-...
claude

# Проверка ключа
curl https://api.anthropic.com/v1/messages \
  -H "x-api-key: $ANTHROPIC_API_KEY" \
  -H "anthropic-version: 2023-06-01" \
  -H "content-type: application/json" \
  -d '{"model":"claude-sonnet-4-6","max_tokens":10,"messages":[{"role":"user","content":"ping"}]}'

Цены API (за 1M токенов)

Модель	Input	Output	Cache write	Cache read
Sonnet 4.6	$3	$15	$3.75	$0.30
Opus 4.6	$15	$75	$18.75	$1.50
Haiku 4.5	$0.80	$4	$1.00	$0.08

Prompt caching снижает стоимость повторяющихся системных промптов и CLAUDE.md — при активных сессиях экономия 60–90% на кешированных входных токенах.

Производительность моделей

Opus 4.6 — SOTA на Terminal-Bench 2.0 (агентное кодирование), контекст 1M токенов, score 78.3% на MRCR v2
Sonnet 4.6 — быстрее Opus, отличное соотношение цена/качество, подходит для 95% задач
Haiku 4.5 — самый быстрый, для массовых простых операций

OAuth vs API Key

	OAuth (браузер)	API Key
Как получить	claude.ai аккаунт	console.anthropic.com
Тарификация	По подписке (Pro/Max)	Pay-as-you-go по токенам
Удалённый сервер	Сложно (нужен браузер)	Просто (env variable)
CI/CD	❌	✅

← Claude Code — главная · → Лимиты и usage · → Интеграции

Актуальные цены API (2026)

Модель	Input (до 200K)	Input (>200K)	Output
Claude Opus 4.6	$5 / MTok	$10 / MTok	$25 / MTok
Claude Sonnet 4.6	$3 / MTok	$6 / MTok	$15 / MTok
Claude Haiku 4.5	$1 / MTok	—	$5 / MTok

MTok = миллион токенов. При запросах длиннее 200K токенов (например, загрузка большой кодовой базы) цена входных токенов удваивается — учитывайте это при работе с монорепозиториями.

Prompt Caching — экономия до 90%

Самая важная оптимизация при работе через API. Если один и тот же системный промпт или контекст файлов отправляется в нескольких запросах, Anthropic кэширует его:

Операция	Sonnet 4.6	Opus 4.6
Запись кэша (cache write)	$3.75 / MTok	$6.25 / MTok
Чтение кэша (cache hit)	$0.30 / MTok	$1.50 / MTok

Один разработчик подсчитал: 4,5 миллиарда токенов кэш-чтений обошлись в $6 750 вместо $67 500 без кэша. Экономия 10×.

Batch API — минус 50% при несрочных задачах

Для задач, которые не требуют мгновенного ответа (рефакторинг, генерация документации, тестов), используйте Batch API:

# Batch API обрабатывает запросы в течение 24 часов
# Стоимость: 50% от стандартной цены
# Sonnet 4.6 batch: $1.50 input / $7.50 output (вместо $3/$15)

Когда Max-подписка выгоднее API

Реальный расчёт от разработчика, отслеживавшего использование 8 месяцев:

Сценарий	Стоимость API	Стоимость Max	Экономия
Лёгкое использование (<50M токенов/мес)	<$100	$100–200	API выгоднее
Среднее (50–200M токенов/мес)	$100–400	$100	Max 5× экономит до 4×
Активное (200M–1B токенов/мес)	$400–2 000	$100–200	Max экономит сотни $
Интенсивное (1B+ токенов/мес)	$2 000+	$200	Max экономит тысячи $

Вывод: При полном ежедневном использовании Claude Code Max 20× обходится примерно в 18 раз дешевле прямого API. Если вы разработчик, использующий Claude как основной инструмент — подписка окупается.

Три модели — три роли: как реально их использовать

Распространённое заблуждение: Opus — самый умный, Haiku — самый тупой, Sonnet — посередине. Поэтому "нужно всегда выбирать Opus". На самом деле у каждой модели есть своя ниша, и правильный выбор сэкономит и деньги, и время.

OPUS 4.6 — Глубокое мышление

Существует для задач, которые Sonnet решает неверно: нестандартные алгоритмы, архитектурные решения с десятками ограничений, рефакторинг тесно связанных систем.

Только в Max 5x / Max 20x

SONNET 4.6 — Рабочая лошадь

Дефолтная модель, правильный выбор для 90% задач. Сильное рассуждение, быстрый ответ, хватает для большинства рефакторингов, написания тестов, анализа кода.

Pro, Max, API

HAIKU 4.5 — Скорость и объём

В 3 раза быстрее Sonnet, в 3,75 раза дешевле. Справляется с классификацией, форматированием, простыми правками, роутингом. Идеален для массовых задач.

API / внутри сессии через /model

Модельная стратегия от опытных разработчиков

По наблюдению сообщества, самые продуктивные разработчики не "выбирают одну модель" — они используют все три в одном рабочем процессе:

Haiku — для быстрых вопросов, объяснений синтаксиса, мелких правок. Не тратить Sonnet на "что значит эта конструкция?"
Sonnet — основная рабочая модель. Написание функций, тестов, рефакторинг, анализ. Дефолт для всего что требует думать.
Opus — перед серьёзным PR или архитектурным решением. "Проверь весь этот код, найди неочевидные ошибки, оцени решение".

«Haiku как роутер: сортирует запросы, простые обрабатывает сам. Sonnet — основная разработка. Opus — как старший ревьюер перед релизом. Это не про экономию токенов, это про правильный инструмент для каждой задачи.»
— паттерн из описания production-систем 2026

Когда Sonnet лучше Opus

Это важный контрпункт: Opus не всегда лучше. Есть ситуации, где Sonnet даёт лучший результат:

Быстрые итерации — Opus думает дольше. Когда вы в потоке и делаете 20 маленьких задач подряд, Sonnet не тормозит рабочий процесс.
Простые задачи — Opus на простом запросе иногда "переусложняет" ответ, добавляя излишние оговорки.
Задачи по шаблону — написать 50 тестов по образцу, сгенерировать CRUD по схеме. Sonnet справится так же хорошо.
Токены и бюджет — Opus потребляет лимит в 5 раз быстрее Sonnet. На Max 20x это важно при интенсивной работе.

Extended Thinking: когда включать

Extended Thinking — режим где модель явно "думает вслух" перед ответом, тратя дополнительные токены на обдумывание. Активируется через ключевые слова:

Слово в запросе	Глубина размышлений	Когда использовать
`think`	~5 000 токенов	Нетривиальный баг, сложный рефакторинг
`think harder`	~10 000 токенов	Архитектурные решения, дизайн API
`ultrathink`	до 31 999 токенов	Самые сложные задачи, полный анализ системы

Реальный случай применения: разработчик несколько дней не мог найти race condition в асинхронном коде. Написал: ultrathink: почему этот код иногда возвращает nil при конкурентных запросах? — Claude за одну сессию нашёл тонкую ошибку синхронизации, которую человек пропустил при нескольких ревью.

Prompt Caching: скрытая оптимизация

При работе через API есть механизм, который мало кто использует осознанно, хотя он встроен в Claude Code: prompt caching. Если в нескольких последовательных запросах первая часть промпта одинакова (например, системный промпт или содержимое CLAUDE.md), Anthropic кэширует её.

Один разработчик, отслеживавший расходы API, обнаружил: из 4,5 миллиарда токенов за год — 4 миллиарда пришлись на кэш-чтения по цене $0.30/MTok вместо $3/MTok. Экономия 10× только за счёт кэширования.

Для Claude Code это работает автоматически — CLAUDE.md кэшируется между запросами одной сессии. При работе через API можно управлять этим явно через параметр cache_control.