Рейтинг OpenRouter за июнь 2026: китайские модели — 61% трафика разработчиков, куда ставить во втором полугодии

По реальному трафику OpenRouter: DeepSeek — 5,13T токенов в неделю, «большая тройка» США за год просела с 70% до 30%. Claude Opus 4.8 удерживает индекс качества 61,4 — лидер по объёму не равен лидеру по качеству.

Если вы сравниваете рейтинг моделей OpenRouter 2026, выбираете между DeepSeek V4 Flash и Claude Opus 4.8 или планируете релизы AI-моделей во второй половине 2026, материал закрывает все ключевые пункты июньского среза: (1) два рейтинга — по компаниям и по моделям; (2) макросдвиг US-доли с 70% до 30%; (3) расхождение лидеров по объёму и по качеству; (4) снятие Claude Fable 5 из-за экспортного контроля; (5) три драйвера ценности китайских моделей; (6) матрица из восьми сценариев; (7) прогноз релизов Q3 и пять макротрендов; (8) сжатие маржи и аргумент за model-agnostic архитектуру; (9) матрица решений и шестишаговый runbook NUKCLOUD. Параллельно: тренды LLM на OpenRouter, недельные токены и счёт, разбор блокировки Claude Fable 5.

00Рейтинг OpenRouter за июнь: компании и Top 10 моделей

OpenRouter — один из немногих источников, где виден реальный прод-трафик, а не пресс-релизный бенчмарк: миллионы разработчиков голосуют кодом и кошельком. Источники: OpenRouter Rankings, Artificial Analysis Intelligence Index, SWE-bench Pro.

Рейтинг по компаниям (недельный объём токенов, на конец июня 2026):

МестоКомпанияПроисхождениеТокены/нед.Доля
1DeepSeekКитай5,13T17,6%
2AnthropicСША4,34T14,8%
3GoogleСША3,66T12,5%
4OpenAIСША2,46T8,4%
5XiaomiКитай2,42T8,3%
6MiniMaxКитай2,37T8,1%
7TencentКитай2,36T8,1%
8Alibaba QwenКитай1,26T4,3%

Китайские вендоры в таблице дают суммарно около 46% недельных токенов; на уровне трафика разработчиков китайские модели уже прошли отметку 60%.

Рейтинг по моделям (средний суточный объём, Top 10):

МестоМодельВендорТокены/сут.
1DeepSeek V4 FlashDeepSeek619B
2Hy3 PreviewTencent451B
3MiniMax M3MiniMax447B
4MiMo-V2.5Xiaomi327B
5DeepSeek V4 ProDeepSeek300B
6Claude Opus 4.7Anthropic263B
7Claude Opus 4.8Anthropic~200B
8Claude Sonnet 4.6Anthropic178B
9Gemini 3 Flash PreviewGoogle156B
10Kimi K2.6Moonshot AI~150B

Таблица отражает не «модную модель», а то, какую архитектуру команды держат в проде, когда важны latency, счёт и стабильность SSE, а не один прогон MMLU.

ЛовушкиПять ошибок при чтении рейтинга

  • Объём токенов = качество: 619B у DeepSeek V4 Flash не означает превосходство над Claude Opus 4.8 — большая часть трафика это completion, роутинг и дешёвые daily-задачи.
  • Игнор экспортного контроля: Claude Fable 5 получил максимальный рейтинг качества, но в середине июня 2026 исчез глобально из-за US export controls. Сильнейшая модель не всегда доступна.
  • Lock-in на одном API: у OpenAI и Anthropic в июне звучали сигналы IPO; после выхода на биржу tier-политика и цены могут резко смениться.
  • Enterprise compliance: китайские модели растут у инди-разработчиков, но Fortune 500 упирается в data residency, аудит и давление Конгресса США.
  • Недооценка Agent-поля: в отчёте Anthropic 2026 State of AI Agents почти 44% вызовов Claude API приходится на математику и CS-задачи — во второй половине 2026 решает стабильность длинных Agent-сессий, а не чат.

01Главный сдвиг: US-модели за год — с 70% до 30%

Данные OpenRouter и Exponential View, которые цитировал Bloomberg, рисуют картину без двусмысленности:

  • Июнь 2025: US-модели (Google + OpenAI + Anthropic) — около 70% токенов OpenRouter
  • Июнь 2026: та же группа — около 30%

Куда делись 40 процентных пунктов? Их забрали китайские модели. Это не история «локальных патриотов в КНР»: база OpenRouter глобальная — США, Европа, Индия. Выбирают DeepSeek, Xiaomi и MiniMax потому, что они дёшевы, быстры и достаточны для ежедневной нагрузки.

Разработчик из Сан-Дiego: «Claude на код — около 10 USD в час. DeepSeek — меньше 50 центов».

Это экономика, не бенчмарк-спорт. В июне же: глобальное снятие Claude Fable 5, IPO-слухи у OpenAI и Anthropic. Если вы всё ещё мыслите категориями 2025 года, архитектурные решения опираются на устаревшие допущения.

02Два разных лидерства: объём и качество

Потолок качества: Claude Opus 4.8 по-прежнему #1 в Artificial Analysis Intelligence Index (срез на конец мая 2026):

МодельИндекс качестваSWE-bench ProКомментарий
Claude Opus 4.861,4 (#1)69,2%Лидер long context и Agent
GPT-5.559–6063,1%Сильнейшая экосистема; быстрый tool calling
Gemini 3.1 Pro57Силён на hardest reasoning
Qwen 3.7 Max57Флагман закрытых китайских моделей
Claude Sonnet 4.680,8% (SWE-bench Verified)Лучший баланс writing / instruction following

Инженер после 20 head-to-head задач: Opus 4.8 выиграл 16, GPT-5.5 — 5, Gemini 3.1 Pro — 4. На длинном контексте Opus уходит в отдельный класс.

Claude Fable 5 когда-то имел рейтинг 100/100 и ~95% на SWE-bench Verified, но в середине июня 2026 ушёл из глобального доступа из-за export controls — статус неясен. Его короткое доминирование показывает: US frontier по чистой capability всё ещё впереди, когда доступ не режут регуляторы.

Чемпионы по объёму: китайские модели держат daily-нагрузку на value. Три механизма:

  1. Цена: MiniMax M3 — $0,60/M input, примерно 1/8 от Claude Opus 4.8 ($5,00/M)
  2. Достаточность: для completion, перевода, summary и рутинного кода китайские модели дают 80–90% frontier-качества
  3. Open weights: DeepSeek V4, MiniMax M3 и аналоги можно self-host — см. runbook локального ds4
Стек разработчика из Дallas: «Сложные задачи — Claude + ChatGPT ~500 USD/мес. Daily coding и speech — MiniMax + Kimi + MiMo ~200 USD/мес. 90% объёма идёт по дешёвому маршруту».

03Матрица выбора по сценариям (июнь 2026)

СценарийМодельПочему
Сложный код / AgentClaude Opus 4.8Топ индекса; лучший long context
Ежедневный coding assistDeepSeek V4 Flash / MiMo-V2.5Цена/скорость
Ultra-low-cost APIMiniMax M3$0,60/M; open weights; self-host
Длинный контекстKimi K2.6 (1M context)Окно 1M при разумной цене
Интеграция GoogleGemini 3.5 FlashНативная поддержка Workspace
Real-time webGrok 4.3Живой поток X/Twitter
Self-hosted deployGLM 5.2 / Kimi K2.6Топ open-weight tier
Генерация изображенийChatGPT Images 2.0Лучший text-in-image
Общий daily chatGPT-5.5На 52,5% меньше галлюцинаций vs GPT-5.3; зрелая экосистема

04Прогноз H2: волна Q3 и пять макротрендов

Q3 2026 может стать самым плотным кварталом релизов в истории LLM. Текущие прогнозы с высокой уверенностью:

МодельВендорОкноФокус
GPT-6OpenAIавг–сен 2026Контекст до ~1,5M (слухи); усиленный Agent stack
Claude Opus 5Anthropic~сентябрь 2026Наследник Opus 4.8; long-horizon Agent
Gemini 4GoogleQ3 2026Multimodal; video и audio input
DeepSeek V5DeepSeekQ3 2026Open weights; ~1T+ params; паритет с closed frontier
GLM 5.2Z.ai (Zhipu)Уже вышелТоп open-weight; сильный coding
Grok 4.3+xAIQ3 20261M context; усиленный real-time web

Три флагманских релиза могут приземлиться в шестинедельном окне с середины августа по конец сентября — смена «короля бенчмарка» опередит любой медиацикл.

Пять макротрендов:

  • Ось конкуренции: «кто сильней» → «кто под сценарий»: пять лабораторий релизят за 90 дней — рациональный split: closed frontier на hardest 5%, китайский open weight на оставшиеся 95% daily volume.
  • Доля Китая растёт; потолок — compliance: у инди на OpenRouter китайские модели могут пройти 70%+; Fortune 500 вряд ли выйдет за 30%.
  • Agent — реальное поле боя: 2026 — год перехода Agent из эксперимента в prod; SWE-bench Pro, OSWorld-Verified и long-horizon completion rate определяют enterprise-контракты.
  • Двойной IPO OpenAI и Anthropic: июньские сигналы пересчитывают оценку всего сектора; публичный рынок давит на прозрачность цен и ускоряет price war с китайскими API — см. IPO Anthropic и финансирование OpenAI.
  • Local inference на consumer iron: к 2027 модели на GPU с 32 GB должны пробить SWE-bench Verified 80% по coding.

05Итог: сжатие маржи и три стратегии US-вендоров

Под текстом рейтинга — быстрое сжатие маржи на model layer. Прорыв DeepSeek в начале 2025 показал: frontier-качество не требует frontier-бюджета на compute. Xiaomi, Tencent, MiniMax и Moonshot масштабировали playbook и опустили базовый API-pricing — tier «достаточно хорошо» в 8–30 раз дешевле premium, а большинство prod-нагрузок живёт именно там.

US-вендоры расходятся по траекториям:

  • OpenAI — экосистема: плагины, enterprise-интеграции, DALL-E, Codex Mobile
  • Anthropic — moat качества: Agent-стек Opus по-прежнему впереди на hard tasks
  • Google — скорость и multimodal: линейка Gemini Flash — один из лучших closed value-tier

Середина «не frontier, но дорого» исчезает. Для разработчика и platform lead ценнее не угадать одну модель, а построить архитектуру со swap моделей без переписывания продукта. Лидер июня через три месяца может смениться — Q3 2026 напомнит об этом снова.

06Шестишаговый runbook: model-agnostic AI на облачном Mac

  1. 01
    Сегментировать нагрузку: «frontier 5%» (Opus 4.8 / GPT-5.5) vs «daily 95%» (DeepSeek V4 Flash / MiniMax M3 / MiMo-V2.5). Сверить с рейтингом OpenRouter CLI и привычками Hermes / Claude Code.
  2. 02
    Шлюз LiteLLM / OpenRouter: на eval-ноде — multi-model fallback; для Fable 5 и других export-controlled моделей заранее прописать путь на Opus 4.8.
  3. 03
    Provision облачного Mac: консоль NUKCLOUD, 32 ГБ+ unified memory для local weights и длинных Agent-сессий; почасовой тест Kimi K2.6 / GLM 5.2 на странице цен.
  4. 04
    TCO-модель: сравнить all-Claude vs Claude frontier + китайский daily vs выделенный Mac 7×24 Agent; заложить tier-repricing после IPO.
  5. 05
    Compliance и data residency: enterprise — обновить vendor questionnaire под export control и congressional review; инди — open-weight self-host для снятия privacy-риска.
  6. 06
    launchd 7×24 Agent: после пилота зафиксировать spec на странице заказа; детали — production runbook и центр помощи.

Multi-model Agent loop на MacBook или shared VPS типично ломается на sleep при закрытой крышке, jitter uplink с обрывом SSE и взлёте счёта по токенам. Когда нужен стабильный 7×24 uptime и смена OpenRouter-маршрута за ночь, мультирегиональные bare-metal Mac / облачные Mac-узлы NUKCLOUD дают выделенные границы tenant и elastic spec под ритм Q3-релизов лучше, чем oversubscribed shared-хост.

07FAQ: рейтинг OpenRouter, июнь 2026

Какая модель была самой популярной на OpenRouter в июне 2026?
По среднесуточным токенам — DeepSeek V4 Flash (~619B), далее Tencent Hy3 Preview (451B) и MiniMax M3 (447B).
DeepSeek лучше Claude?
Зависит от задачи. DeepSeek лидирует по объёму и value; Claude Opus 4.8 держит индекс 61,4 и сильнее на сложном коде и long context. Daily — DeepSeek; hardest 5% — Opus.
Какую долю на OpenRouter занимают китайские модели?
В top-10 компаний — ~46% недельных токенов; трафик разработчиков по китайским моделям — свыше 60%. US «большая тройка» (Google + OpenAI + Anthropic) упала с ~70% (июнь 2025) до ~30% (июнь 2026).
Что случилось с Claude Fable 5?
Рейтинг 100/100, затем глобальное снятие в середине июня 2026 из-за US export controls — статус неясен. См. разбор блокировки.
Какие frontier-модели ждать в Q3 2026?
Высокая вероятность: OpenAI GPT-6 (авг–сен), Anthropic Claude Opus 5 (~сентябрь), Google Gemini 4, DeepSeek V5 (open weights, ~1T params), xAI Grok 4.3+.
Стоит ли брать MiniMax M3 API?
Input $0,60/M — ~1/8 от Opus 4.8; open weights и self-host. Сильный fit для ultra-low-cost prod API и daily coding.
Какой AI лучше для программирования в 2026?
Сложный Agent / long context: Claude Opus 4.8. Daily completion: DeepSeek V4 Flash или MiMo-V2.5. Value API: MiniMax M3. Verified coding: Claude Sonnet 4.6 — SWE-bench Verified 80,8%.
Почему не стоит ставить на одного вендора?
В Q3 несколько frontier-моделей могут выйти за шесть недель. Export controls, IPO-repricing и price war меняют доступность и cost. Ценнее model-agnostic routing, чем контракт с одним поставщиком.

Материал от 1 июля 2026; данные — на конец июня 2026. Не инвестиционный совет. Внешние ссылки: OpenRouter Rankings, Artificial Analysis, отчёт Anthropic 2026 об Agent.