OpenAI GPT-5.6 официально: Sol, Terra, Luna — полный разбор (2026)

26 июня 2026 OpenAI выпустила серию GPT-5.6 — флагман Sol, сбалансированный Terra и лёгкий Luna. Sol набирает 91,9 % на TerminalBench 2.1 и 96,7 % в CTF; доступ ограничен примерно 20 одобренными партнёрами. Обновлено 27 июня 2026.

Если вы оцениваете frontier-модели в Cursor, Codex или собственном Agent-pipeline, GPT-5.6 — главный релиз июня 2026: OpenAI впервые именует модели по телам Солнечной системы — Sol (Солнце), Terra (Земля), Luna (Луна) — для флагмана, среднего и лёгкого сегмента. Материал для tech lead и AI-инженеров: обзор и цены; три модели с режимами Sol Max/Ultra; TerminalBench, CTF, ExploitBench, GeneBench и HealthBench; Cerebras 750 token/s с июля; указ Трампа от 2 июня и госпроверка; сравнение с Claude Mythos 5; таймлайн доступа и сценарии; шестишаговый runbook и FAQ. Контекст: сводка утечек GPT-5.6, блокировка Claude Fable 5 и альтернативы и гид по multi-agent архитектуре.

00Обзор GPT-5.6: Sol, Terra, Luna — цены и ключевые факты

МодельПозиционированиеВводВыводСильная сторона
GPT-5.6 SolФлагман / максимум$5 / млн токенов$30 / млн токеновTerminalBench 2.1 №1 в мире (91,9 %)
GPT-5.6 TerraСбалансированная / основная$2,50 / млн токенов$15 / млн токеновБлизко к GPT-5.5, на 50 % дешевле
GPT-5.6 LunaЛёгкая / быстрая$1 / млн токенов$6 / млн токеновВысокочастотные задачи, ~80 % дешевле Sol

Текущий статус: По требованию правительства США GPT-5.6 доступен в preview только ~20 одобренным партнёрам; широкий доступ ожидается в ближайшие недели. Polymarket оценивает полный релиз до 31 июля примерно в 87 %. Контекстное окно ~1,5 млн токенов (ожидается полная System Card).

Цифры для цитирования: Sol TerminalBench 2.1 91,9 % (Ultra) / 88,8 % (стандарт); CTF Sol 96,7 %, Terra 91,84 %, Luna 85,19 %; Agent's Last Exam Sol 50,9 % (единственный выше 50 %); HealthBench Professional Sol 60,5 (+8,7 к GPT-5.5); ускорение Cerebras 750 token/s.

ЛовушкиТипичные ошибки в период запуска GPT-5.6

  • Ожидание широкого доступа: Большинство пользователей и компаний ещё не могут вызвать GPT-5.6 в ChatGPT или публичном API — preview только у ~20 партнёров.
  • Неверный tier: Luna для сложных agent-задач недостаточен; Sol Ultra на простые summary резко увеличивает расход токенов.
  • Игнорирование стоимости Ultra: Параллельные multi-agent в Ultra улучшают TerminalBench, но потребляют гораздо больше output-токенов.
  • CTF-рекорд ≠ автономный exploit: Red team OpenAI подтверждает: Sol не строит полноценные рабочие exploit-цепочки для Chromium/Firefox самостоятельно.
  • Зависимость от одного вендора: Mythos 5 offline, Gemini 3.5 Pro перенесён — без multi-model fallback команда уязвима в окне проверки.
  • Нестабильная локальная среда eval: Длинные agent-бенчмарки и SSE-стриминг часто обрываются на ноутбуке в сне или shared VPS.

01Контекст: солнечная номенклатура и госпроверка

В ночь на 27 июня 2026 OpenAI выпустила GPT-5.6 с новой номенклатурой — Sol (Солнце), Terra (Земля), Luna (Луна) — для флагмана, среднего и лёгкого уровня. Источники: анонс OpenAI, Deployment Safety System Card, VentureBeat, SiliconAngle и TechTimes.

Запуск прошёл не гладко. После указа Трампа от 2 июня 2026 OpenAI обязана пройти госпроверку безопасности перед широким релизом — впервые США требует ограниченный выпуск frontier-модели. CEO Сэм Альтман сотрудничает, но публично заявил:

«Мы не считаем, что эта модель госодобрения должна стать долгосрочной отраслевой нормой. Она отдаляет лучшие инструменты от пользователей, разработчиков, компаний и глобальных партнёров, которым они нужнее всего.»

GPT-5.6 — первая линейка OpenAI, где все три модели получили уровень «High» по кибербезопасности; Luna — первый не-флагман с одновременным «High» в кибербезопасности и биологии.

02GPT-5.6 Sol, Terra, Luna подробно

GPT-5.6 Sol — флагман

Sol — самая мощная модель OpenAI для сложного кода, длинных киберцепочек и многошаговых автономных agent-workflow. Два новых режима inference:

  • Режим Max: Больше времени на рассуждение, ниже скорость, максимальная точность.
  • Режим Ultra: Multi-agent архитектура — Sol декомпозирует задачу, распределяет параллельным sub-agent и синтезирует результат; ядро скачка TerminalBench.

Цена: $5 / млн input-токенов, $30 / млн output-токенов (как у GPT-5.5).

GPT-5.6 Terra — сбалансированная

Terra — корпоративный workhorse для поддержки, внутренних инструментов и анализа документов. Близко к GPT-5.5 при 50 % меньших затратах — лучший выбор для массового деплоя. Цена: $2,50 / $15 за MTok.

GPT-5.6 Luna — лёгкая

Luna оптимизирована под высокую частоту и низкую задержку: summary, черновики, ежедневная автоматизация. Цена: $1 / $6 за MTok, примерно на 80 % дешевле Sol.

03Бенчмарки: TerminalBench, CTF и life sciences

Программирование: TerminalBench 2.1 (89 сложных CLI-задач, multi-tool координация)

МодельРезультатРежим
GPT-5.6 Sol91,9 %Ultra (multi-agent)
GPT-5.6 Sol88,8 %Стандарт
Claude Mythos 588,0 %Стандарт
GPT-5.583,4 %Стандарт
Gemini 3.1 Pro Preview70,7 %Стандарт

Sol сместил Claude Mythos 5 с первого места всего за 17 дней — Mythos 5 поднялся на вершину 9 июня.

Длинные agent-задачи: Agent's Last Exam

МодельДоля завершения (code mode)
GPT-5.6 Sol50,9 % (единственный выше 50 %)
GPT-5.6 LunaНемного выше GPT-5.5

Кибербезопасность: CTF и ExploitBench

МодельCTF hit rate
Sol96,7 %
Terra91,84 %
Luna85,19 %

На ExploitBench Sol почти на уровне Anthropic Mythos Preview, но использует лишь около трети output-токенов. Тесты показывают: Sol находит уязвимости в Chromium и Firefox, но не строит автономно полноценные рабочие exploit-цепочки — ниже порога «Cyber Critical».

Life sciences: На GeneBench v1 Sol с меньшим числом токенов достигает уровня GPT-5.5 или выше; HealthBench Professional Sol 60,5, +8,7 к GPT-5.5.

Меры безопасности (вся линейка): Классификаторы злоупотреблений в реальном времени, проверка чувствительных workflow на уровне аккаунта, 700 000 GPU-часов эквивалента A100 автоматизированного red team, универсальные jailbreak-тесты и крупная inference-модель как вторичный фильтр; внешние организации тестировали до релиза.

04Скорость: Cerebras 750 token/s с июля

С июля GPT-5.6 Sol будет развёрнут на платформе Cerebras для избранных enterprise-клиентов со скоростью до 750 token/s. Для сравнения: большинство флагманов выдают 50–150 token/s — 750 token/s может сократить время ответа в 5–15 раз, качественный скачок для realtime coding assistant и streaming AI. Первоначально только для отобранных enterprise.

05Политика: госвмешательство в релизы ИИ

2 июня 2026 Трамп подписал указ, дающий правительству США до 30 дней доступа до публичного релиза для проверки безопасности. Не обязателен, но эффективен. 26 июня при координации OSTP и ONCD OpenAI согласилась ограничить GPT-5.6 ~20 предварительно одобренными «trusted partners».

КомпанияМодельСтатус
OpenAIGPT-5.6 Sol/Terra/LunaPreview только ~20 партнёров
AnthropicClaude Fable 5 / Mythos 5Offline 12 июня (export control)
GoogleGemini 3.5 ProПеренесён на июль, планировался на июнь

Июнь 2026 должен был стать «супер-месяцем релизов» — вместо этого три ведущих лаборатории застряли у порога публикации.

06GPT-5.6 Sol vs Claude Mythos 5

ИзмерениеGPT-5.6 SolClaude Mythos 5
TerminalBench 2.191,9 % (Ultra) / 88,8 %88,0 %
ExploitBenchНа уровне Mythos Preview, ~⅓ токеновНе опубликовано
Цена ввода$5 / MБыло $10 / M (offline)
ДоступностьОграниченный preview, широкий доступ через неделиOffline (export control)
Контекст~1,5 M токенов200K токенов

Sol обходит Mythos 5 на code и cyber-бенчмарках примерно за половину цены. Fable 5 сохраняет преимущества на SWE-bench Pro; полная System Card GPT-5.6 ещё впереди.

07Когда будет доступен GPT-5.6? Таймлайн

Текущая фаза (июнь 2026): Только ~20 одобренных партнёров через API и Codex; обычные пользователи ChatGPT без доступа.

Скоро (ожидается июль 2026):

  • Широкий rollout ChatGPT (Plus/Pro в приоритете)
  • Публичный API
  • Sol на Cerebras для enterprise (до 750 token/s)
  • Полная System Card GPT-5.6 и отчёты по бенчмаркам

Polymarket оценивает полный доступ до 31 июля 2026 примерно в 87 %.

08Сценарии: Sol, Terra или Luna?

ЗадачаРекомендуемая модель
Сложный код, отладка, multi-step agentsSol (Ultra для тяжёлых задач)
Анализ документов, поддержка, большие объёмы APITerra
Частые summary, черновики, автоматизацияLuna
Ограниченный бюджет, нужен уровень GPT-5.5Terra (−50 %)
Latency-критичные realtime-приложения (после июля)Sol on Cerebras

09Шестишаговый runbook: eval GPT-5.6 на облачном Mac

  1. 01
    Зафиксировать prod-baseline и fallback: В LiteLLM или routing-слое оставить gpt-5.5 / claude-opus-4-8 по умолчанию; зарезервировать слоты для gpt-5.6-sol, gpt-5.6-terra, gpt-5.6-luna. См. сравнение AI coding assistant.
  2. 02
    Развернуть облачный Mac: Консоль NUKCLOUD32 ГБ+ unified memory для TerminalBench и Ultra multi-agent eval; почасовые тарифы на странице цен.
  3. 03
    Установить eval toolchain: По SSH Node.js / Python 3.12, Cursor CLI, OpenCode или subset TerminalBench; подключить MCP tool servers по туториалу MCP Server.
  4. 04
    Собрать тестовый набор Sol/Terra/Luna: Три класса prompt — сложное CLI-планирование (TerminalBench), CTF-задачи, long-context retrieval; логировать latency, токены и completion rate.
  5. 05
    Подписаться на официальные каналы и тестировать изолированно: анонс OpenAI GPT-5.6 и Deployment Safety System Card; после API-релиза проверить Sol Max/Ultra в sandbox до prod-трафика. CI: runbook GitHub AI Agent Workspace.
  6. 06
    Eval-нода 7×24 через launchd: plist LaunchAgents для benchmark runner и длинных SSE-соединений; после пилота зафиксировать spec на странице заказа. Детали: production runbook NUKCLOUD и центр помощи.

На локальном MacBook или shared VPS Ultra multi-agent сессии прерываются при сне, SSE рвётся от jitter сети, preview API-квоты делятся между разработчиками. Для TerminalBench, CTF-исследований и MCP tool servers со стабильным 7×24 multi-region bare metal и облачные Mac-ноды NUKCLOUD лучше соответствуют frontier eval workflow.

10FAQ по GPT-5.6

Можно ли уже использовать GPT-5.6 в ChatGPT?
Пока нет для обычных пользователей. Сейчас только ~20 партнёров через API и Codex; rollout ChatGPT ожидается в ближайшие недели (июль 2026).
GPT-5.6 Sol лучше Claude Fable 5 для программирования?
Sol лидирует на TerminalBench 2.1 с 91,9 % против 88 % у Mythos 5. Fable 5 сильнее на SWE-bench Pro; официальные GPT-5.6 SWE-bench ещё не опубликованы. Sol стоит примерно вдвое дешевле Fable 5.
Что такое режим Ultra у GPT-5.6 Sol?
Ultra разворачивает несколько параллельных sub-agent, обрабатывающих части задачи, затем объединяет результат. Значительно выше качество на сложных задачах, но существенно больше расход токенов.
Почему доступ к GPT-5.6 ограничен?
Правительство США (Белый дом / OSTP / ONCD) потребовало проверку безопасности с ограниченным доступом по указу Трампа от 2 июня. OpenAI сотрудничает, но против превращения этого в постоянную норму.
Насколько быстра версия Cerebras?
До 750 token/s — примерно в 5–15 раз быстрее типичных флагманов (50–150 token/s). С июля 2026 для отобранных enterprise-клиентов.
Каков размер контекстного окна?
Сообщается ~1,5 млн токенов против 1 млн у GPT-5.5. Официальное подтверждение с полной System Card.
Подходят ли все три модели GPT-5.6 для кибербезопасности?
Все три имеют рейтинг кибербезопасности «High» от OpenAI с значительной способностью к исследованию уязвимостей. OpenAI подтверждает: нет автономного построения рабочих exploit; активны многоуровневые guardrails.