Если вы оцениваете frontier-модели в Cursor, Codex или собственном Agent-pipeline, GPT-5.6 — главный релиз июня 2026: OpenAI впервые именует модели по телам Солнечной системы — Sol (Солнце), Terra (Земля), Luna (Луна) — для флагмана, среднего и лёгкого сегмента. Материал для tech lead и AI-инженеров: обзор и цены; три модели с режимами Sol Max/Ultra; TerminalBench, CTF, ExploitBench, GeneBench и HealthBench; Cerebras 750 token/s с июля; указ Трампа от 2 июня и госпроверка; сравнение с Claude Mythos 5; таймлайн доступа и сценарии; шестишаговый runbook и FAQ. Контекст: сводка утечек GPT-5.6, блокировка Claude Fable 5 и альтернативы и гид по multi-agent архитектуре.
00Обзор GPT-5.6: Sol, Terra, Luna — цены и ключевые факты
| Модель | Позиционирование | Ввод | Вывод | Сильная сторона |
|---|---|---|---|---|
| GPT-5.6 Sol | Флагман / максимум | $5 / млн токенов | $30 / млн токенов | TerminalBench 2.1 №1 в мире (91,9 %) |
| GPT-5.6 Terra | Сбалансированная / основная | $2,50 / млн токенов | $15 / млн токенов | Близко к GPT-5.5, на 50 % дешевле |
| GPT-5.6 Luna | Лёгкая / быстрая | $1 / млн токенов | $6 / млн токенов | Высокочастотные задачи, ~80 % дешевле Sol |
Текущий статус: По требованию правительства США GPT-5.6 доступен в preview только ~20 одобренным партнёрам; широкий доступ ожидается в ближайшие недели. Polymarket оценивает полный релиз до 31 июля примерно в 87 %. Контекстное окно ~1,5 млн токенов (ожидается полная System Card).
ЛовушкиТипичные ошибки в период запуска GPT-5.6
- Ожидание широкого доступа: Большинство пользователей и компаний ещё не могут вызвать GPT-5.6 в ChatGPT или публичном API — preview только у ~20 партнёров.
- Неверный tier: Luna для сложных agent-задач недостаточен; Sol Ultra на простые summary резко увеличивает расход токенов.
- Игнорирование стоимости Ultra: Параллельные multi-agent в Ultra улучшают TerminalBench, но потребляют гораздо больше output-токенов.
- CTF-рекорд ≠ автономный exploit: Red team OpenAI подтверждает: Sol не строит полноценные рабочие exploit-цепочки для Chromium/Firefox самостоятельно.
- Зависимость от одного вендора: Mythos 5 offline, Gemini 3.5 Pro перенесён — без multi-model fallback команда уязвима в окне проверки.
- Нестабильная локальная среда eval: Длинные agent-бенчмарки и SSE-стриминг часто обрываются на ноутбуке в сне или shared VPS.
01Контекст: солнечная номенклатура и госпроверка
В ночь на 27 июня 2026 OpenAI выпустила GPT-5.6 с новой номенклатурой — Sol (Солнце), Terra (Земля), Luna (Луна) — для флагмана, среднего и лёгкого уровня. Источники: анонс OpenAI, Deployment Safety System Card, VentureBeat, SiliconAngle и TechTimes.
Запуск прошёл не гладко. После указа Трампа от 2 июня 2026 OpenAI обязана пройти госпроверку безопасности перед широким релизом — впервые США требует ограниченный выпуск frontier-модели. CEO Сэм Альтман сотрудничает, но публично заявил:
GPT-5.6 — первая линейка OpenAI, где все три модели получили уровень «High» по кибербезопасности; Luna — первый не-флагман с одновременным «High» в кибербезопасности и биологии.
02GPT-5.6 Sol, Terra, Luna подробно
GPT-5.6 Sol — флагман
Sol — самая мощная модель OpenAI для сложного кода, длинных киберцепочек и многошаговых автономных agent-workflow. Два новых режима inference:
- Режим Max: Больше времени на рассуждение, ниже скорость, максимальная точность.
- Режим Ultra: Multi-agent архитектура — Sol декомпозирует задачу, распределяет параллельным sub-agent и синтезирует результат; ядро скачка TerminalBench.
Цена: $5 / млн input-токенов, $30 / млн output-токенов (как у GPT-5.5).
GPT-5.6 Terra — сбалансированная
Terra — корпоративный workhorse для поддержки, внутренних инструментов и анализа документов. Близко к GPT-5.5 при 50 % меньших затратах — лучший выбор для массового деплоя. Цена: $2,50 / $15 за MTok.
GPT-5.6 Luna — лёгкая
Luna оптимизирована под высокую частоту и низкую задержку: summary, черновики, ежедневная автоматизация. Цена: $1 / $6 за MTok, примерно на 80 % дешевле Sol.
03Бенчмарки: TerminalBench, CTF и life sciences
Программирование: TerminalBench 2.1 (89 сложных CLI-задач, multi-tool координация)
| Модель | Результат | Режим |
|---|---|---|
| GPT-5.6 Sol | 91,9 % | Ultra (multi-agent) |
| GPT-5.6 Sol | 88,8 % | Стандарт |
| Claude Mythos 5 | 88,0 % | Стандарт |
| GPT-5.5 | 83,4 % | Стандарт |
| Gemini 3.1 Pro Preview | 70,7 % | Стандарт |
Sol сместил Claude Mythos 5 с первого места всего за 17 дней — Mythos 5 поднялся на вершину 9 июня.
Длинные agent-задачи: Agent's Last Exam
| Модель | Доля завершения (code mode) |
|---|---|
| GPT-5.6 Sol | 50,9 % (единственный выше 50 %) |
| GPT-5.6 Luna | Немного выше GPT-5.5 |
Кибербезопасность: CTF и ExploitBench
| Модель | CTF hit rate |
|---|---|
| Sol | 96,7 % |
| Terra | 91,84 % |
| Luna | 85,19 % |
На ExploitBench Sol почти на уровне Anthropic Mythos Preview, но использует лишь около трети output-токенов. Тесты показывают: Sol находит уязвимости в Chromium и Firefox, но не строит автономно полноценные рабочие exploit-цепочки — ниже порога «Cyber Critical».
Life sciences: На GeneBench v1 Sol с меньшим числом токенов достигает уровня GPT-5.5 или выше; HealthBench Professional Sol 60,5, +8,7 к GPT-5.5.
Меры безопасности (вся линейка): Классификаторы злоупотреблений в реальном времени, проверка чувствительных workflow на уровне аккаунта, 700 000 GPU-часов эквивалента A100 автоматизированного red team, универсальные jailbreak-тесты и крупная inference-модель как вторичный фильтр; внешние организации тестировали до релиза.
04Скорость: Cerebras 750 token/s с июля
С июля GPT-5.6 Sol будет развёрнут на платформе Cerebras для избранных enterprise-клиентов со скоростью до 750 token/s. Для сравнения: большинство флагманов выдают 50–150 token/s — 750 token/s может сократить время ответа в 5–15 раз, качественный скачок для realtime coding assistant и streaming AI. Первоначально только для отобранных enterprise.
05Политика: госвмешательство в релизы ИИ
2 июня 2026 Трамп подписал указ, дающий правительству США до 30 дней доступа до публичного релиза для проверки безопасности. Не обязателен, но эффективен. 26 июня при координации OSTP и ONCD OpenAI согласилась ограничить GPT-5.6 ~20 предварительно одобренными «trusted partners».
| Компания | Модель | Статус |
|---|---|---|
| OpenAI | GPT-5.6 Sol/Terra/Luna | Preview только ~20 партнёров |
| Anthropic | Claude Fable 5 / Mythos 5 | Offline 12 июня (export control) |
| Gemini 3.5 Pro | Перенесён на июль, планировался на июнь |
Июнь 2026 должен был стать «супер-месяцем релизов» — вместо этого три ведущих лаборатории застряли у порога публикации.
06GPT-5.6 Sol vs Claude Mythos 5
| Измерение | GPT-5.6 Sol | Claude Mythos 5 |
|---|---|---|
| TerminalBench 2.1 | 91,9 % (Ultra) / 88,8 % | 88,0 % |
| ExploitBench | На уровне Mythos Preview, ~⅓ токенов | Не опубликовано |
| Цена ввода | $5 / M | Было $10 / M (offline) |
| Доступность | Ограниченный preview, широкий доступ через недели | Offline (export control) |
| Контекст | ~1,5 M токенов | 200K токенов |
Sol обходит Mythos 5 на code и cyber-бенчмарках примерно за половину цены. Fable 5 сохраняет преимущества на SWE-bench Pro; полная System Card GPT-5.6 ещё впереди.
07Когда будет доступен GPT-5.6? Таймлайн
Текущая фаза (июнь 2026): Только ~20 одобренных партнёров через API и Codex; обычные пользователи ChatGPT без доступа.
Скоро (ожидается июль 2026):
- Широкий rollout ChatGPT (Plus/Pro в приоритете)
- Публичный API
- Sol на Cerebras для enterprise (до 750 token/s)
- Полная System Card GPT-5.6 и отчёты по бенчмаркам
Polymarket оценивает полный доступ до 31 июля 2026 примерно в 87 %.
08Сценарии: Sol, Terra или Luna?
| Задача | Рекомендуемая модель |
|---|---|
| Сложный код, отладка, multi-step agents | Sol (Ultra для тяжёлых задач) |
| Анализ документов, поддержка, большие объёмы API | Terra |
| Частые summary, черновики, автоматизация | Luna |
| Ограниченный бюджет, нужен уровень GPT-5.5 | Terra (−50 %) |
| Latency-критичные realtime-приложения (после июля) | Sol on Cerebras |
09Шестишаговый runbook: eval GPT-5.6 на облачном Mac
-
01
Зафиксировать prod-baseline и fallback: В LiteLLM или routing-слое оставить
gpt-5.5/claude-opus-4-8по умолчанию; зарезервировать слоты дляgpt-5.6-sol,gpt-5.6-terra,gpt-5.6-luna. См. сравнение AI coding assistant. -
02
Развернуть облачный Mac: Консоль NUKCLOUD — 32 ГБ+ unified memory для TerminalBench и Ultra multi-agent eval; почасовые тарифы на странице цен.
-
03
Установить eval toolchain: По SSH Node.js / Python 3.12, Cursor CLI, OpenCode или subset TerminalBench; подключить MCP tool servers по туториалу MCP Server.
-
04
Собрать тестовый набор Sol/Terra/Luna: Три класса prompt — сложное CLI-планирование (TerminalBench), CTF-задачи, long-context retrieval; логировать latency, токены и completion rate.
-
05
Подписаться на официальные каналы и тестировать изолированно: анонс OpenAI GPT-5.6 и Deployment Safety System Card; после API-релиза проверить Sol Max/Ultra в sandbox до prod-трафика. CI: runbook GitHub AI Agent Workspace.
-
06
Eval-нода 7×24 через launchd: plist
LaunchAgentsдля benchmark runner и длинных SSE-соединений; после пилота зафиксировать spec на странице заказа. Детали: production runbook NUKCLOUD и центр помощи.
На локальном MacBook или shared VPS Ultra multi-agent сессии прерываются при сне, SSE рвётся от jitter сети, preview API-квоты делятся между разработчиками. Для TerminalBench, CTF-исследований и MCP tool servers со стабильным 7×24 multi-region bare metal и облачные Mac-ноды NUKCLOUD лучше соответствуют frontier eval workflow.