Если вы сравниваете рейтинг моделей OpenRouter 2026, выбираете между DeepSeek V4 Flash и Claude Opus 4.8 или планируете релизы AI-моделей во второй половине 2026, материал закрывает все ключевые пункты июньского среза: (1) два рейтинга — по компаниям и по моделям; (2) макросдвиг US-доли с 70% до 30%; (3) расхождение лидеров по объёму и по качеству; (4) снятие Claude Fable 5 из-за экспортного контроля; (5) три драйвера ценности китайских моделей; (6) матрица из восьми сценариев; (7) прогноз релизов Q3 и пять макротрендов; (8) сжатие маржи и аргумент за model-agnostic архитектуру; (9) матрица решений и шестишаговый runbook NUKCLOUD. Параллельно: тренды LLM на OpenRouter, недельные токены и счёт, разбор блокировки Claude Fable 5.
00Рейтинг OpenRouter за июнь: компании и Top 10 моделей
OpenRouter — один из немногих источников, где виден реальный прод-трафик, а не пресс-релизный бенчмарк: миллионы разработчиков голосуют кодом и кошельком. Источники: OpenRouter Rankings, Artificial Analysis Intelligence Index, SWE-bench Pro.
Рейтинг по компаниям (недельный объём токенов, на конец июня 2026):
| Место | Компания | Происхождение | Токены/нед. | Доля |
|---|---|---|---|---|
| 1 | DeepSeek | Китай | 5,13T | 17,6% |
| 2 | Anthropic | США | 4,34T | 14,8% |
| 3 | США | 3,66T | 12,5% | |
| 4 | OpenAI | США | 2,46T | 8,4% |
| 5 | Xiaomi | Китай | 2,42T | 8,3% |
| 6 | MiniMax | Китай | 2,37T | 8,1% |
| 7 | Tencent | Китай | 2,36T | 8,1% |
| 8 | Alibaba Qwen | Китай | 1,26T | 4,3% |
Китайские вендоры в таблице дают суммарно около 46% недельных токенов; на уровне трафика разработчиков китайские модели уже прошли отметку 60%.
Рейтинг по моделям (средний суточный объём, Top 10):
| Место | Модель | Вендор | Токены/сут. |
|---|---|---|---|
| 1 | DeepSeek V4 Flash | DeepSeek | 619B |
| 2 | Hy3 Preview | Tencent | 451B |
| 3 | MiniMax M3 | MiniMax | 447B |
| 4 | MiMo-V2.5 | Xiaomi | 327B |
| 5 | DeepSeek V4 Pro | DeepSeek | 300B |
| 6 | Claude Opus 4.7 | Anthropic | 263B |
| 7 | Claude Opus 4.8 | Anthropic | ~200B |
| 8 | Claude Sonnet 4.6 | Anthropic | 178B |
| 9 | Gemini 3 Flash Preview | 156B | |
| 10 | Kimi K2.6 | Moonshot AI | ~150B |
Таблица отражает не «модную модель», а то, какую архитектуру команды держат в проде, когда важны latency, счёт и стабильность SSE, а не один прогон MMLU.
ЛовушкиПять ошибок при чтении рейтинга
- Объём токенов = качество: 619B у DeepSeek V4 Flash не означает превосходство над Claude Opus 4.8 — большая часть трафика это completion, роутинг и дешёвые daily-задачи.
- Игнор экспортного контроля: Claude Fable 5 получил максимальный рейтинг качества, но в середине июня 2026 исчез глобально из-за US export controls. Сильнейшая модель не всегда доступна.
- Lock-in на одном API: у OpenAI и Anthropic в июне звучали сигналы IPO; после выхода на биржу tier-политика и цены могут резко смениться.
- Enterprise compliance: китайские модели растут у инди-разработчиков, но Fortune 500 упирается в data residency, аудит и давление Конгресса США.
- Недооценка Agent-поля: в отчёте Anthropic 2026 State of AI Agents почти 44% вызовов Claude API приходится на математику и CS-задачи — во второй половине 2026 решает стабильность длинных Agent-сессий, а не чат.
01Главный сдвиг: US-модели за год — с 70% до 30%
Данные OpenRouter и Exponential View, которые цитировал Bloomberg, рисуют картину без двусмысленности:
- Июнь 2025: US-модели (Google + OpenAI + Anthropic) — около 70% токенов OpenRouter
- Июнь 2026: та же группа — около 30%
Куда делись 40 процентных пунктов? Их забрали китайские модели. Это не история «локальных патриотов в КНР»: база OpenRouter глобальная — США, Европа, Индия. Выбирают DeepSeek, Xiaomi и MiniMax потому, что они дёшевы, быстры и достаточны для ежедневной нагрузки.
Это экономика, не бенчмарк-спорт. В июне же: глобальное снятие Claude Fable 5, IPO-слухи у OpenAI и Anthropic. Если вы всё ещё мыслите категориями 2025 года, архитектурные решения опираются на устаревшие допущения.
02Два разных лидерства: объём и качество
Потолок качества: Claude Opus 4.8 по-прежнему #1 в Artificial Analysis Intelligence Index (срез на конец мая 2026):
| Модель | Индекс качества | SWE-bench Pro | Комментарий |
|---|---|---|---|
| Claude Opus 4.8 | 61,4 (#1) | 69,2% | Лидер long context и Agent |
| GPT-5.5 | 59–60 | 63,1% | Сильнейшая экосистема; быстрый tool calling |
| Gemini 3.1 Pro | 57 | — | Силён на hardest reasoning |
| Qwen 3.7 Max | 57 | — | Флагман закрытых китайских моделей |
| Claude Sonnet 4.6 | — | 80,8% (SWE-bench Verified) | Лучший баланс writing / instruction following |
Инженер после 20 head-to-head задач: Opus 4.8 выиграл 16, GPT-5.5 — 5, Gemini 3.1 Pro — 4. На длинном контексте Opus уходит в отдельный класс.
Claude Fable 5 когда-то имел рейтинг 100/100 и ~95% на SWE-bench Verified, но в середине июня 2026 ушёл из глобального доступа из-за export controls — статус неясен. Его короткое доминирование показывает: US frontier по чистой capability всё ещё впереди, когда доступ не режут регуляторы.
Чемпионы по объёму: китайские модели держат daily-нагрузку на value. Три механизма:
- Цена: MiniMax M3 — $0,60/M input, примерно 1/8 от Claude Opus 4.8 ($5,00/M)
- Достаточность: для completion, перевода, summary и рутинного кода китайские модели дают 80–90% frontier-качества
- Open weights: DeepSeek V4, MiniMax M3 и аналоги можно self-host — см. runbook локального ds4
03Матрица выбора по сценариям (июнь 2026)
| Сценарий | Модель | Почему |
|---|---|---|
| Сложный код / Agent | Claude Opus 4.8 | Топ индекса; лучший long context |
| Ежедневный coding assist | DeepSeek V4 Flash / MiMo-V2.5 | Цена/скорость |
| Ultra-low-cost API | MiniMax M3 | $0,60/M; open weights; self-host |
| Длинный контекст | Kimi K2.6 (1M context) | Окно 1M при разумной цене |
| Интеграция Google | Gemini 3.5 Flash | Нативная поддержка Workspace |
| Real-time web | Grok 4.3 | Живой поток X/Twitter |
| Self-hosted deploy | GLM 5.2 / Kimi K2.6 | Топ open-weight tier |
| Генерация изображений | ChatGPT Images 2.0 | Лучший text-in-image |
| Общий daily chat | GPT-5.5 | На 52,5% меньше галлюцинаций vs GPT-5.3; зрелая экосистема |
04Прогноз H2: волна Q3 и пять макротрендов
Q3 2026 может стать самым плотным кварталом релизов в истории LLM. Текущие прогнозы с высокой уверенностью:
| Модель | Вендор | Окно | Фокус |
|---|---|---|---|
| GPT-6 | OpenAI | авг–сен 2026 | Контекст до ~1,5M (слухи); усиленный Agent stack |
| Claude Opus 5 | Anthropic | ~сентябрь 2026 | Наследник Opus 4.8; long-horizon Agent |
| Gemini 4 | Q3 2026 | Multimodal; video и audio input | |
| DeepSeek V5 | DeepSeek | Q3 2026 | Open weights; ~1T+ params; паритет с closed frontier |
| GLM 5.2 | Z.ai (Zhipu) | Уже вышел | Топ open-weight; сильный coding |
| Grok 4.3+ | xAI | Q3 2026 | 1M context; усиленный real-time web |
Три флагманских релиза могут приземлиться в шестинедельном окне с середины августа по конец сентября — смена «короля бенчмарка» опередит любой медиацикл.
Пять макротрендов:
- Ось конкуренции: «кто сильней» → «кто под сценарий»: пять лабораторий релизят за 90 дней — рациональный split: closed frontier на hardest 5%, китайский open weight на оставшиеся 95% daily volume.
- Доля Китая растёт; потолок — compliance: у инди на OpenRouter китайские модели могут пройти 70%+; Fortune 500 вряд ли выйдет за 30%.
- Agent — реальное поле боя: 2026 — год перехода Agent из эксперимента в prod; SWE-bench Pro, OSWorld-Verified и long-horizon completion rate определяют enterprise-контракты.
- Двойной IPO OpenAI и Anthropic: июньские сигналы пересчитывают оценку всего сектора; публичный рынок давит на прозрачность цен и ускоряет price war с китайскими API — см. IPO Anthropic и финансирование OpenAI.
- Local inference на consumer iron: к 2027 модели на GPU с 32 GB должны пробить SWE-bench Verified 80% по coding.
05Итог: сжатие маржи и три стратегии US-вендоров
Под текстом рейтинга — быстрое сжатие маржи на model layer. Прорыв DeepSeek в начале 2025 показал: frontier-качество не требует frontier-бюджета на compute. Xiaomi, Tencent, MiniMax и Moonshot масштабировали playbook и опустили базовый API-pricing — tier «достаточно хорошо» в 8–30 раз дешевле premium, а большинство prod-нагрузок живёт именно там.
US-вендоры расходятся по траекториям:
- OpenAI — экосистема: плагины, enterprise-интеграции, DALL-E, Codex Mobile
- Anthropic — moat качества: Agent-стек Opus по-прежнему впереди на hard tasks
- Google — скорость и multimodal: линейка Gemini Flash — один из лучших closed value-tier
Середина «не frontier, но дорого» исчезает. Для разработчика и platform lead ценнее не угадать одну модель, а построить архитектуру со swap моделей без переписывания продукта. Лидер июня через три месяца может смениться — Q3 2026 напомнит об этом снова.
06Шестишаговый runbook: model-agnostic AI на облачном Mac
-
01
Сегментировать нагрузку: «frontier 5%» (Opus 4.8 / GPT-5.5) vs «daily 95%» (DeepSeek V4 Flash / MiniMax M3 / MiMo-V2.5). Сверить с рейтингом OpenRouter CLI и привычками Hermes / Claude Code.
-
02
Шлюз LiteLLM / OpenRouter: на eval-ноде — multi-model fallback; для Fable 5 и других export-controlled моделей заранее прописать путь на Opus 4.8.
-
03
Provision облачного Mac: консоль NUKCLOUD, 32 ГБ+ unified memory для local weights и длинных Agent-сессий; почасовой тест Kimi K2.6 / GLM 5.2 на странице цен.
-
04
TCO-модель: сравнить all-Claude vs Claude frontier + китайский daily vs выделенный Mac 7×24 Agent; заложить tier-repricing после IPO.
-
05
Compliance и data residency: enterprise — обновить vendor questionnaire под export control и congressional review; инди — open-weight self-host для снятия privacy-риска.
-
06
launchd 7×24 Agent: после пилота зафиксировать spec на странице заказа; детали — production runbook и центр помощи.
Multi-model Agent loop на MacBook или shared VPS типично ломается на sleep при закрытой крышке, jitter uplink с обрывом SSE и взлёте счёта по токенам. Когда нужен стабильный 7×24 uptime и смена OpenRouter-маршрута за ночь, мультирегиональные bare-metal Mac / облачные Mac-узлы NUKCLOUD дают выделенные границы tenant и elastic spec под ритм Q3-релизов лучше, чем oversubscribed shared-хост.
07FAQ: рейтинг OpenRouter, июнь 2026
Материал от 1 июля 2026; данные — на конец июня 2026. Не инвестиционный совет. Внешние ссылки: OpenRouter Rankings, Artificial Analysis, отчёт Anthropic 2026 об Agent.