GPT-5.6 официально: Sol, Terra, Luna — модели, бенчмарки и сравнение (2026)

Если вы оцениваете frontier-модели в Cursor, Codex или собственном Agent-pipeline, GPT-5.6 — главный релиз июня 2026: OpenAI впервые именует модели по телам Солнечной системы — Sol (Солнце), Terra (Земля), Luna (Луна) — для флагмана, среднего и лёгкого сегмента. Материал для tech lead и AI-инженеров: обзор и цены; три модели с режимами Sol Max/Ultra; TerminalBench, CTF, ExploitBench, GeneBench и HealthBench; Cerebras 750 token/s с июля; указ Трампа от 2 июня и госпроверка; сравнение с Claude Mythos 5; таймлайн доступа и сценарии; шестишаговый runbook и FAQ. Контекст: сводка утечек GPT-5.6, блокировка Claude Fable 5 и альтернативы и гид по multi-agent архитектуре.

00Обзор GPT-5.6: Sol, Terra, Luna — цены и ключевые факты

Модель	Позиционирование	Ввод	Вывод	Сильная сторона
GPT-5.6 Sol	Флагман / максимум	$5 / млн токенов	$30 / млн токенов	TerminalBench 2.1 №1 в мире (91,9 %)
GPT-5.6 Terra	Сбалансированная / основная	$2,50 / млн токенов	$15 / млн токенов	Близко к GPT-5.5, на 50 % дешевле
GPT-5.6 Luna	Лёгкая / быстрая	$1 / млн токенов	$6 / млн токенов	Высокочастотные задачи, ~80 % дешевле Sol

Текущий статус: По требованию правительства США GPT-5.6 доступен в preview только ~20 одобренным партнёрам; широкий доступ ожидается в ближайшие недели. Polymarket оценивает полный релиз до 31 июля примерно в 87 %. Контекстное окно ~1,5 млн токенов (ожидается полная System Card).

Цифры для цитирования: Sol TerminalBench 2.1 91,9 % (Ultra) / 88,8 % (стандарт); CTF Sol 96,7 %, Terra 91,84 %, Luna 85,19 %; Agent's Last Exam Sol 50,9 % (единственный выше 50 %); HealthBench Professional Sol 60,5 (+8,7 к GPT-5.5); ускорение Cerebras 750 token/s.

ЛовушкиТипичные ошибки в период запуска GPT-5.6

Ожидание широкого доступа: Большинство пользователей и компаний ещё не могут вызвать GPT-5.6 в ChatGPT или публичном API — preview только у ~20 партнёров.
Неверный tier: Luna для сложных agent-задач недостаточен; Sol Ultra на простые summary резко увеличивает расход токенов.
Игнорирование стоимости Ultra: Параллельные multi-agent в Ultra улучшают TerminalBench, но потребляют гораздо больше output-токенов.
CTF-рекорд ≠ автономный exploit: Red team OpenAI подтверждает: Sol не строит полноценные рабочие exploit-цепочки для Chromium/Firefox самостоятельно.
Зависимость от одного вендора: Mythos 5 offline, Gemini 3.5 Pro перенесён — без multi-model fallback команда уязвима в окне проверки.
Нестабильная локальная среда eval: Длинные agent-бенчмарки и SSE-стриминг часто обрываются на ноутбуке в сне или shared VPS.

01Контекст: солнечная номенклатура и госпроверка

В ночь на 27 июня 2026 OpenAI выпустила GPT-5.6 с новой номенклатурой — Sol (Солнце), Terra (Земля), Luna (Луна) — для флагмана, среднего и лёгкого уровня. Источники: анонс OpenAI, Deployment Safety System Card, VentureBeat, SiliconAngle и TechTimes.

Запуск прошёл не гладко. После указа Трампа от 2 июня 2026 OpenAI обязана пройти госпроверку безопасности перед широким релизом — впервые США требует ограниченный выпуск frontier-модели. CEO Сэм Альтман сотрудничает, но публично заявил:

«Мы не считаем, что эта модель госодобрения должна стать долгосрочной отраслевой нормой. Она отдаляет лучшие инструменты от пользователей, разработчиков, компаний и глобальных партнёров, которым они нужнее всего.»

GPT-5.6 — первая линейка OpenAI, где все три модели получили уровень «High» по кибербезопасности; Luna — первый не-флагман с одновременным «High» в кибербезопасности и биологии.

02GPT-5.6 Sol, Terra, Luna подробно

GPT-5.6 Sol — флагман

Sol — самая мощная модель OpenAI для сложного кода, длинных киберцепочек и многошаговых автономных agent-workflow. Два новых режима inference:

Режим Max: Больше времени на рассуждение, ниже скорость, максимальная точность.
Режим Ultra: Multi-agent архитектура — Sol декомпозирует задачу, распределяет параллельным sub-agent и синтезирует результат; ядро скачка TerminalBench.

Цена: $5 / млн input-токенов, $30 / млн output-токенов (как у GPT-5.5).

GPT-5.6 Terra — сбалансированная

Terra — корпоративный workhorse для поддержки, внутренних инструментов и анализа документов. Близко к GPT-5.5 при 50 % меньших затратах — лучший выбор для массового деплоя. Цена: $2,50 / $15 за MTok.

GPT-5.6 Luna — лёгкая

Luna оптимизирована под высокую частоту и низкую задержку: summary, черновики, ежедневная автоматизация. Цена: $1 / $6 за MTok, примерно на 80 % дешевле Sol.

03Бенчмарки: TerminalBench, CTF и life sciences

Программирование: TerminalBench 2.1 (89 сложных CLI-задач, multi-tool координация)

Модель	Результат	Режим
GPT-5.6 Sol	91,9 %	Ultra (multi-agent)
GPT-5.6 Sol	88,8 %	Стандарт
Claude Mythos 5	88,0 %	Стандарт
GPT-5.5	83,4 %	Стандарт
Gemini 3.1 Pro Preview	70,7 %	Стандарт

Sol сместил Claude Mythos 5 с первого места всего за 17 дней — Mythos 5 поднялся на вершину 9 июня.

Длинные agent-задачи: Agent's Last Exam

Модель	Доля завершения (code mode)
GPT-5.6 Sol	50,9 % (единственный выше 50 %)
GPT-5.6 Luna	Немного выше GPT-5.5

Кибербезопасность: CTF и ExploitBench

Модель	CTF hit rate
Sol	96,7 %
Terra	91,84 %
Luna	85,19 %

На ExploitBench Sol почти на уровне Anthropic Mythos Preview, но использует лишь около трети output-токенов. Тесты показывают: Sol находит уязвимости в Chromium и Firefox, но не строит автономно полноценные рабочие exploit-цепочки — ниже порога «Cyber Critical».

Life sciences: На GeneBench v1 Sol с меньшим числом токенов достигает уровня GPT-5.5 или выше; HealthBench Professional Sol 60,5, +8,7 к GPT-5.5.

Меры безопасности (вся линейка): Классификаторы злоупотреблений в реальном времени, проверка чувствительных workflow на уровне аккаунта, 700 000 GPU-часов эквивалента A100 автоматизированного red team, универсальные jailbreak-тесты и крупная inference-модель как вторичный фильтр; внешние организации тестировали до релиза.

04Скорость: Cerebras 750 token/s с июля

С июля GPT-5.6 Sol будет развёрнут на платформе Cerebras для избранных enterprise-клиентов со скоростью до 750 token/s. Для сравнения: большинство флагманов выдают 50–150 token/s — 750 token/s может сократить время ответа в 5–15 раз, качественный скачок для realtime coding assistant и streaming AI. Первоначально только для отобранных enterprise.

05Политика: госвмешательство в релизы ИИ

2 июня 2026 Трамп подписал указ, дающий правительству США до 30 дней доступа до публичного релиза для проверки безопасности. Не обязателен, но эффективен. 26 июня при координации OSTP и ONCD OpenAI согласилась ограничить GPT-5.6 ~20 предварительно одобренными «trusted partners».

Компания	Модель	Статус
OpenAI	GPT-5.6 Sol/Terra/Luna	Preview только ~20 партнёров
Anthropic	Claude Fable 5 / Mythos 5	Offline 12 июня (export control)
Google	Gemini 3.5 Pro	Перенесён на июль, планировался на июнь

Июнь 2026 должен был стать «супер-месяцем релизов» — вместо этого три ведущих лаборатории застряли у порога публикации.

06GPT-5.6 Sol vs Claude Mythos 5

Измерение	GPT-5.6 Sol	Claude Mythos 5
TerminalBench 2.1	91,9 % (Ultra) / 88,8 %	88,0 %
ExploitBench	На уровне Mythos Preview, ~⅓ токенов	Не опубликовано
Цена ввода	$5 / M	Было $10 / M (offline)
Доступность	Ограниченный preview, широкий доступ через недели	Offline (export control)
Контекст	~1,5 M токенов	200K токенов

Sol обходит Mythos 5 на code и cyber-бенчмарках примерно за половину цены. Fable 5 сохраняет преимущества на SWE-bench Pro; полная System Card GPT-5.6 ещё впереди.

07Когда будет доступен GPT-5.6? Таймлайн

Текущая фаза (июнь 2026): Только ~20 одобренных партнёров через API и Codex; обычные пользователи ChatGPT без доступа.

Скоро (ожидается июль 2026):

Широкий rollout ChatGPT (Plus/Pro в приоритете)
Публичный API
Sol на Cerebras для enterprise (до 750 token/s)
Полная System Card GPT-5.6 и отчёты по бенчмаркам

Polymarket оценивает полный доступ до 31 июля 2026 примерно в 87 %.

08Сценарии: Sol, Terra или Luna?

Задача	Рекомендуемая модель
Сложный код, отладка, multi-step agents	Sol (Ultra для тяжёлых задач)
Анализ документов, поддержка, большие объёмы API	Terra
Частые summary, черновики, автоматизация	Luna
Ограниченный бюджет, нужен уровень GPT-5.5	Terra (−50 %)
Latency-критичные realtime-приложения (после июля)	Sol on Cerebras

09Шестишаговый runbook: eval GPT-5.6 на облачном Mac

01
Зафиксировать prod-baseline и fallback: В LiteLLM или routing-слое оставить gpt-5.5 / claude-opus-4-8 по умолчанию; зарезервировать слоты для gpt-5.6-sol, gpt-5.6-terra, gpt-5.6-luna. См. сравнение AI coding assistant.
02
Развернуть облачный Mac: Консоль NUKCLOUD — 32 ГБ+ unified memory для TerminalBench и Ultra multi-agent eval; почасовые тарифы на странице цен.
03
Установить eval toolchain: По SSH Node.js / Python 3.12, Cursor CLI, OpenCode или subset TerminalBench; подключить MCP tool servers по туториалу MCP Server.
04
Собрать тестовый набор Sol/Terra/Luna: Три класса prompt — сложное CLI-планирование (TerminalBench), CTF-задачи, long-context retrieval; логировать latency, токены и completion rate.
05
Подписаться на официальные каналы и тестировать изолированно: анонс OpenAI GPT-5.6 и Deployment Safety System Card; после API-релиза проверить Sol Max/Ultra в sandbox до prod-трафика. CI: runbook GitHub AI Agent Workspace.
06
Eval-нода 7×24 через launchd: plist LaunchAgents для benchmark runner и длинных SSE-соединений; после пилота зафиксировать spec на странице заказа. Детали: production runbook NUKCLOUD и центр помощи.

На локальном MacBook или shared VPS Ultra multi-agent сессии прерываются при сне, SSE рвётся от jitter сети, preview API-квоты делятся между разработчиками. Для TerminalBench, CTF-исследований и MCP tool servers со стабильным 7×24 multi-region bare metal и облачные Mac-ноды NUKCLOUD лучше соответствуют frontier eval workflow.

10FAQ по GPT-5.6

Можно ли уже использовать GPT-5.6 в ChatGPT?

Пока нет для обычных пользователей. Сейчас только ~20 партнёров через API и Codex; rollout ChatGPT ожидается в ближайшие недели (июль 2026).

GPT-5.6 Sol лучше Claude Fable 5 для программирования?

Sol лидирует на TerminalBench 2.1 с 91,9 % против 88 % у Mythos 5. Fable 5 сильнее на SWE-bench Pro; официальные GPT-5.6 SWE-bench ещё не опубликованы. Sol стоит примерно вдвое дешевле Fable 5.

Что такое режим Ultra у GPT-5.6 Sol?

Ultra разворачивает несколько параллельных sub-agent, обрабатывающих части задачи, затем объединяет результат. Значительно выше качество на сложных задачах, но существенно больше расход токенов.

Почему доступ к GPT-5.6 ограничен?

Правительство США (Белый дом / OSTP / ONCD) потребовало проверку безопасности с ограниченным доступом по указу Трампа от 2 июня. OpenAI сотрудничает, но против превращения этого в постоянную норму.

Насколько быстра версия Cerebras?

До 750 token/s — примерно в 5–15 раз быстрее типичных флагманов (50–150 token/s). С июля 2026 для отобранных enterprise-клиентов.

Каков размер контекстного окна?

Сообщается ~1,5 млн токенов против 1 млн у GPT-5.5. Официальное подтверждение с полной System Card.

Подходят ли все три модели GPT-5.6 для кибербезопасности?

Все три имеют рейтинг кибербезопасности «High» от OpenAI с значительной способностью к исследованию уязвимостей. OpenAI подтверждает: нет автономного построения рабочих exploit; активны многоуровневые guardrails.

OpenAI GPT-5.6 официально: Sol, Terra, Luna — полный разбор (2026)