Рейтинг OpenRouter за июнь 2026: китайские модели — 61% трафика разработчиков, куда ставить во втором полугодии

Если вы сравниваете рейтинг моделей OpenRouter 2026, выбираете между DeepSeek V4 Flash и Claude Opus 4.8 или планируете релизы AI-моделей во второй половине 2026, материал закрывает все ключевые пункты июньского среза: (1) два рейтинга — по компаниям и по моделям; (2) макросдвиг US-доли с 70% до 30%; (3) расхождение лидеров по объёму и по качеству; (4) снятие Claude Fable 5 из-за экспортного контроля; (5) три драйвера ценности китайских моделей; (6) матрица из восьми сценариев; (7) прогноз релизов Q3 и пять макротрендов; (8) сжатие маржи и аргумент за model-agnostic архитектуру; (9) матрица решений и шестишаговый runbook NUKCLOUD. Параллельно: тренды LLM на OpenRouter, недельные токены и счёт, разбор блокировки Claude Fable 5.

00Рейтинг OpenRouter за июнь: компании и Top 10 моделей

OpenRouter — один из немногих источников, где виден реальный прод-трафик, а не пресс-релизный бенчмарк: миллионы разработчиков голосуют кодом и кошельком. Источники: OpenRouter Rankings, Artificial Analysis Intelligence Index, SWE-bench Pro.

Рейтинг по компаниям (недельный объём токенов, на конец июня 2026):

Место	Компания	Происхождение	Токены/нед.	Доля
1	DeepSeek	Китай	5,13T	17,6%
2	Anthropic	США	4,34T	14,8%
3	Google	США	3,66T	12,5%
4	OpenAI	США	2,46T	8,4%
5	Xiaomi	Китай	2,42T	8,3%
6	MiniMax	Китай	2,37T	8,1%
7	Tencent	Китай	2,36T	8,1%
8	Alibaba Qwen	Китай	1,26T	4,3%

Китайские вендоры в таблице дают суммарно около 46% недельных токенов; на уровне трафика разработчиков китайские модели уже прошли отметку 60%.

Рейтинг по моделям (средний суточный объём, Top 10):

Место	Модель	Вендор	Токены/сут.
1	DeepSeek V4 Flash	DeepSeek	619B
2	Hy3 Preview	Tencent	451B
3	MiniMax M3	MiniMax	447B
4	MiMo-V2.5	Xiaomi	327B
5	DeepSeek V4 Pro	DeepSeek	300B
6	Claude Opus 4.7	Anthropic	263B
7	Claude Opus 4.8	Anthropic	~200B
8	Claude Sonnet 4.6	Anthropic	178B
9	Gemini 3 Flash Preview	Google	156B
10	Kimi K2.6	Moonshot AI	~150B

Таблица отражает не «модную модель», а то, какую архитектуру команды держат в проде, когда важны latency, счёт и стабильность SSE, а не один прогон MMLU.

ЛовушкиПять ошибок при чтении рейтинга

Объём токенов = качество: 619B у DeepSeek V4 Flash не означает превосходство над Claude Opus 4.8 — большая часть трафика это completion, роутинг и дешёвые daily-задачи.
Игнор экспортного контроля: Claude Fable 5 получил максимальный рейтинг качества, но в середине июня 2026 исчез глобально из-за US export controls. Сильнейшая модель не всегда доступна.
Lock-in на одном API: у OpenAI и Anthropic в июне звучали сигналы IPO; после выхода на биржу tier-политика и цены могут резко смениться.
Enterprise compliance: китайские модели растут у инди-разработчиков, но Fortune 500 упирается в data residency, аудит и давление Конгресса США.
Недооценка Agent-поля: в отчёте Anthropic 2026 State of AI Agents почти 44% вызовов Claude API приходится на математику и CS-задачи — во второй половине 2026 решает стабильность длинных Agent-сессий, а не чат.

01Главный сдвиг: US-модели за год — с 70% до 30%

Данные OpenRouter и Exponential View, которые цитировал Bloomberg, рисуют картину без двусмысленности:

Июнь 2025: US-модели (Google + OpenAI + Anthropic) — около 70% токенов OpenRouter
Июнь 2026: та же группа — около 30%

Куда делись 40 процентных пунктов? Их забрали китайские модели. Это не история «локальных патриотов в КНР»: база OpenRouter глобальная — США, Европа, Индия. Выбирают DeepSeek, Xiaomi и MiniMax потому, что они дёшевы, быстры и достаточны для ежедневной нагрузки.

Разработчик из Сан-Дiego: «Claude на код — около 10 USD в час. DeepSeek — меньше 50 центов».

Это экономика, не бенчмарк-спорт. В июне же: глобальное снятие Claude Fable 5, IPO-слухи у OpenAI и Anthropic. Если вы всё ещё мыслите категориями 2025 года, архитектурные решения опираются на устаревшие допущения.

02Два разных лидерства: объём и качество

Потолок качества: Claude Opus 4.8 по-прежнему #1 в Artificial Analysis Intelligence Index (срез на конец мая 2026):

Модель	Индекс качества	SWE-bench Pro	Комментарий
Claude Opus 4.8	61,4 (#1)	69,2%	Лидер long context и Agent
GPT-5.5	59–60	63,1%	Сильнейшая экосистема; быстрый tool calling
Gemini 3.1 Pro	57	—	Силён на hardest reasoning
Qwen 3.7 Max	57	—	Флагман закрытых китайских моделей
Claude Sonnet 4.6	—	80,8% (SWE-bench Verified)	Лучший баланс writing / instruction following

Инженер после 20 head-to-head задач: Opus 4.8 выиграл 16, GPT-5.5 — 5, Gemini 3.1 Pro — 4. На длинном контексте Opus уходит в отдельный класс.

Claude Fable 5 когда-то имел рейтинг 100/100 и ~95% на SWE-bench Verified, но в середине июня 2026 ушёл из глобального доступа из-за export controls — статус неясен. Его короткое доминирование показывает: US frontier по чистой capability всё ещё впереди, когда доступ не режут регуляторы.

Чемпионы по объёму: китайские модели держат daily-нагрузку на value. Три механизма:

Цена: MiniMax M3 — $0,60/M input, примерно 1/8 от Claude Opus 4.8 ($5,00/M)
Достаточность: для completion, перевода, summary и рутинного кода китайские модели дают 80–90% frontier-качества
Open weights: DeepSeek V4, MiniMax M3 и аналоги можно self-host — см. runbook локального ds4

Стек разработчика из Дallas: «Сложные задачи — Claude + ChatGPT ~500 USD/мес. Daily coding и speech — MiniMax + Kimi + MiMo ~200 USD/мес. 90% объёма идёт по дешёвому маршруту».

03Матрица выбора по сценариям (июнь 2026)

Сценарий	Модель	Почему
Сложный код / Agent	Claude Opus 4.8	Топ индекса; лучший long context
Ежедневный coding assist	DeepSeek V4 Flash / MiMo-V2.5	Цена/скорость
Ultra-low-cost API	MiniMax M3	$0,60/M; open weights; self-host
Длинный контекст	Kimi K2.6 (1M context)	Окно 1M при разумной цене
Интеграция Google	Gemini 3.5 Flash	Нативная поддержка Workspace
Real-time web	Grok 4.3	Живой поток X/Twitter
Self-hosted deploy	GLM 5.2 / Kimi K2.6	Топ open-weight tier
Генерация изображений	ChatGPT Images 2.0	Лучший text-in-image
Общий daily chat	GPT-5.5	На 52,5% меньше галлюцинаций vs GPT-5.3; зрелая экосистема

04Прогноз H2: волна Q3 и пять макротрендов

Q3 2026 может стать самым плотным кварталом релизов в истории LLM. Текущие прогнозы с высокой уверенностью:

Модель	Вендор	Окно	Фокус
GPT-6	OpenAI	авг–сен 2026	Контекст до ~1,5M (слухи); усиленный Agent stack
Claude Opus 5	Anthropic	~сентябрь 2026	Наследник Opus 4.8; long-horizon Agent
Gemini 4	Google	Q3 2026	Multimodal; video и audio input
DeepSeek V5	DeepSeek	Q3 2026	Open weights; ~1T+ params; паритет с closed frontier
GLM 5.2	Z.ai (Zhipu)	Уже вышел	Топ open-weight; сильный coding
Grok 4.3+	xAI	Q3 2026	1M context; усиленный real-time web

Три флагманских релиза могут приземлиться в шестинедельном окне с середины августа по конец сентября — смена «короля бенчмарка» опередит любой медиацикл.

Пять макротрендов:

Ось конкуренции: «кто сильней» → «кто под сценарий»: пять лабораторий релизят за 90 дней — рациональный split: closed frontier на hardest 5%, китайский open weight на оставшиеся 95% daily volume.
Доля Китая растёт; потолок — compliance: у инди на OpenRouter китайские модели могут пройти 70%+; Fortune 500 вряд ли выйдет за 30%.
Agent — реальное поле боя: 2026 — год перехода Agent из эксперимента в prod; SWE-bench Pro, OSWorld-Verified и long-horizon completion rate определяют enterprise-контракты.
Двойной IPO OpenAI и Anthropic: июньские сигналы пересчитывают оценку всего сектора; публичный рынок давит на прозрачность цен и ускоряет price war с китайскими API — см. IPO Anthropic и финансирование OpenAI.
Local inference на consumer iron: к 2027 модели на GPU с 32 GB должны пробить SWE-bench Verified 80% по coding.

05Итог: сжатие маржи и три стратегии US-вендоров

Под текстом рейтинга — быстрое сжатие маржи на model layer. Прорыв DeepSeek в начале 2025 показал: frontier-качество не требует frontier-бюджета на compute. Xiaomi, Tencent, MiniMax и Moonshot масштабировали playbook и опустили базовый API-pricing — tier «достаточно хорошо» в 8–30 раз дешевле premium, а большинство prod-нагрузок живёт именно там.

US-вендоры расходятся по траекториям:

OpenAI — экосистема: плагины, enterprise-интеграции, DALL-E, Codex Mobile
Anthropic — moat качества: Agent-стек Opus по-прежнему впереди на hard tasks
Google — скорость и multimodal: линейка Gemini Flash — один из лучших closed value-tier

Середина «не frontier, но дорого» исчезает. Для разработчика и platform lead ценнее не угадать одну модель, а построить архитектуру со swap моделей без переписывания продукта. Лидер июня через три месяца может смениться — Q3 2026 напомнит об этом снова.

06Шестишаговый runbook: model-agnostic AI на облачном Mac

01
Сегментировать нагрузку: «frontier 5%» (Opus 4.8 / GPT-5.5) vs «daily 95%» (DeepSeek V4 Flash / MiniMax M3 / MiMo-V2.5). Сверить с рейтингом OpenRouter CLI и привычками Hermes / Claude Code.
02
Шлюз LiteLLM / OpenRouter: на eval-ноде — multi-model fallback; для Fable 5 и других export-controlled моделей заранее прописать путь на Opus 4.8.
03
Provision облачного Mac: консоль NUKCLOUD, 32 ГБ+ unified memory для local weights и длинных Agent-сессий; почасовой тест Kimi K2.6 / GLM 5.2 на странице цен.
04
TCO-модель: сравнить all-Claude vs Claude frontier + китайский daily vs выделенный Mac 7×24 Agent; заложить tier-repricing после IPO.
05
Compliance и data residency: enterprise — обновить vendor questionnaire под export control и congressional review; инди — open-weight self-host для снятия privacy-риска.
06
launchd 7×24 Agent: после пилота зафиксировать spec на странице заказа; детали — production runbook и центр помощи.

Multi-model Agent loop на MacBook или shared VPS типично ломается на sleep при закрытой крышке, jitter uplink с обрывом SSE и взлёте счёта по токенам. Когда нужен стабильный 7×24 uptime и смена OpenRouter-маршрута за ночь, мультирегиональные bare-metal Mac / облачные Mac-узлы NUKCLOUD дают выделенные границы tenant и elastic spec под ритм Q3-релизов лучше, чем oversubscribed shared-хост.

07FAQ: рейтинг OpenRouter, июнь 2026

Какая модель была самой популярной на OpenRouter в июне 2026?

По среднесуточным токенам — DeepSeek V4 Flash (~619B), далее Tencent Hy3 Preview (451B) и MiniMax M3 (447B).

DeepSeek лучше Claude?

Зависит от задачи. DeepSeek лидирует по объёму и value; Claude Opus 4.8 держит индекс 61,4 и сильнее на сложном коде и long context. Daily — DeepSeek; hardest 5% — Opus.

Какую долю на OpenRouter занимают китайские модели?

В top-10 компаний — ~46% недельных токенов; трафик разработчиков по китайским моделям — свыше 60%. US «большая тройка» (Google + OpenAI + Anthropic) упала с ~70% (июнь 2025) до ~30% (июнь 2026).

Что случилось с Claude Fable 5?

Рейтинг 100/100, затем глобальное снятие в середине июня 2026 из-за US export controls — статус неясен. См. разбор блокировки.

Какие frontier-модели ждать в Q3 2026?

Высокая вероятность: OpenAI GPT-6 (авг–сен), Anthropic Claude Opus 5 (~сентябрь), Google Gemini 4, DeepSeek V5 (open weights, ~1T params), xAI Grok 4.3+.

Стоит ли брать MiniMax M3 API?

Input $0,60/M — ~1/8 от Opus 4.8; open weights и self-host. Сильный fit для ultra-low-cost prod API и daily coding.

Какой AI лучше для программирования в 2026?

Сложный Agent / long context: Claude Opus 4.8. Daily completion: DeepSeek V4 Flash или MiMo-V2.5. Value API: MiniMax M3. Verified coding: Claude Sonnet 4.6 — SWE-bench Verified 80,8%.

Почему не стоит ставить на одного вендора?

В Q3 несколько frontier-моделей могут выйти за шесть недель. Export controls, IPO-repricing и price war меняют доступность и cost. Ценнее model-agnostic routing, чем контракт с одним поставщиком.

Материал от 1 июля 2026; данные — на конец июня 2026. Не инвестиционный совет. Внешние ссылки: OpenRouter Rankings, Artificial Analysis, отчёт Anthropic 2026 об Agent.