6月 AI モデルランキング徹底分析:中国モデルが OpenRouter を「掌握」、下半期は誰に賭ける?

OpenRouter の実トラフィックでは DeepSeek の週トークン 5.13T が首位、米国三社の合計シェアは1年で 70% から 30% へ急落しました。Claude Opus 4.8 は総合指数 61.4 で品質の頂点を守っています——使用量首位と品質首位は別物です。

OpenRouter モデルランキング 2026DeepSeek V4 Flash と Claude Opus 4.8 の使い分け2026 下半期の AI モデル予測に関心がある方へ——本記事は原稿の全要点を網羅します。① 6月の企業・モデル双榜单、② 米国モデルシェア 70%→30% の転換、③ 使用量チャンピオンと品質天井の二層解釈、④ Claude Fable 5 の輸出規制による下架、⑤ 中国モデルのコスパ三要素、⑥ 8 シナリオ選定マトリクス、⑦ Q3 リリース予測と五大マクロトレンド、⑧ 利益圧縮とモデル非依存アーキテクチャの結論、⑨ 決定マトリクスと NUKCLOUD 六ステップ Runbook。あわせて OpenRouter 大規模言語モデルトレンド週間トークン請求の真実Claude Fable 5 規制解説 も参照できます。

00OpenRouter 6月榜单の全体像:企業順位とモデル Top 10

OpenRouter は世界規模の開発者が実際に叩いている API 呼び出し量を集約する、最も参照価値の高いデータ源の一つです。ベンダー自報ではなく、コードが選んだ結果だけが並びます。出典:OpenRouter RankingsArtificial Analysis Intelligence Index、SWE-bench Pro。

企業別順位(週トークン量、2026年6月時点):

順位企業本拠地週トークン量シェア
1DeepSeek中国5.13T17.6%
2Anthropic米国4.34T14.8%
3Google米国3.66T12.5%
4OpenAI米国2.46T8.4%
5小米 (Xiaomi)中国2.42T8.3%
6MiniMax中国2.37T8.1%
7腾讯 (Tencent)中国2.36T8.1%
8阿里 Qwen中国1.26T4.3%

Top 10 内の中国企業合計は約 46% です。開発者トラフィック全体では中国モデルが 60% 超の関門を突破しています。

モデル別順位(日次トークン量 Top 10):

順位モデルベンダー日次トークン
1DeepSeek V4 FlashDeepSeek619B
2Hy3 Preview腾讯451B
3MiniMax M3MiniMax447B
4MiMo-V2.5小米327B
5DeepSeek V4 ProDeepSeek300B
6Claude Opus 4.7Anthropic263B
7Claude Opus 4.8Anthropic~200B
8Claude Sonnet 4.6Anthropic178B
9Gemini 3 Flash PreviewGoogle156B
10Kimi K2.6Moonshot AI~150B

この榜单が示すのは単なる「人気投票」ではなく、本番環境で開発者が実際に信頼しているモデルの分布です。

痛点ランキングを読む際、チームが陥りやすい五つの落とし穴

  • トークン量を品質と同一視する:DeepSeek V4 Flash の日次 619B は、Claude Opus 4.8 より優れている証拠ではありません。日常補完と高コスパルーティングが大半です。
  • 輸出規制を軽視する:Claude Fable 5 は満点級の品質評価を獲得していましたが、2026年6月中旬に政府の輸出規制により全世界で下架されました。最強モデルが必ず使えるとは限りません。
  • 単一 API に一本化する:OpenAI と Anthropic の双方が6月に IPO 意向を伝えています。上場後の価格と tier 戦略は大きく変わる可能性があります。
  • エンタープライズコンプラの盲点:中国モデルは個人開発者層で伸び続けていますが、Fortune 500 の調達はデータセキュリティと米国議会の監視の下にあります。
  • Agent 戦場を見落とす:Anthropic《2026 State of AI Agents Report》では Claude API 呼び出しの約 44% が数学・コンピュータ科学タスクに由来します。下半期は長時間 Agent の安定性が勝負です。

01最大の転換:1年で米国モデルは 70% から 30% へ

Bloomberg が引用した OpenRouter と Exponential View のデータは、構図の変化をはっきり示しています。

  • 2025年6月:米国モデル(Google + OpenAI + Anthropic 合計)が OpenRouter トークンの約 70% を占めていました
  • 2026年6月:この数字は 30% まで下落しました

失われた40ポイントは、ほぼすべて中国モデルが吸収しています。これは「中国の開発者が国産を選んだ」だけの話ではありません。OpenRouter ユーザーは米国・欧州・インドを含むグローバル層が主体で、彼らが DeepSeek・小米・MiniMax を選ぶ理由は 安い・速い・十分使える からです。

サンディエゴの開発者の証言:「Claude でコードを書くと1時間あたり約10ドル。DeepSeek なら50セント以下。」

これは品質の物語ではなく、経済学の物語です。6月には Claude Fable 5 の規制下架、OpenAI と Anthropic の IPO 報道なども重なりました。昨年の認識のまま選定を続けると、すでに陳腐化した前提の上で意思決定することになります。

02二層で理解する:「使用量首位」≠「品質首位」

品質の天井:Claude Opus 4.8 が総合能力首位(Artificial Analysis Intelligence Index、2026年5月末時点):

モデル総合品質指数SWE-bench Pro備考
Claude Opus 4.861.4(#1)69.2%長コンテキストと Agent で先行
GPT-5.559–6063.1%エコシステム最強、ツール呼び出しが速い
Gemini 3.1 Pro57最難推論タスクで突出
Qwen 3.7 Max57中国閉源フロンティアの代表
Claude Sonnet 4.680.8%(SWE-bench Verified)ライティングと指示追従が最良

あるエンジニアが20タスクで実測した結果では、Claude Opus 4.8 が16勝、GPT-5.5 が5勝、Gemini 3.1 Pro が4勝でした。特に長コンテキストタスクでは Opus の差は圧倒的です。

Claude Fable 5 は全榜单で満点級(100/100)の品質評価、SWE-bench Verified 約 95% を記録していましたが、2026年6月中旬に政府の輸出規制で全世界下架され、現状は未定です。米国トップモデルが純能力面では依然先行していることを示しています。

使用量チャンピオン:中国モデルはコスパで日常タスクを支配——核心は次の三つです。

  1. 価格:MiniMax M3 API の入力は $0.60/M トークンで、Claude Opus 4.8($5.00/M)の約 1/8 です
  2. 十分さ:日常のプログラミング補助、コード補完、翻訳、要約では、中国モデルがトップモデルの 80–90% の効果に達します
  3. オープンウェイト:DeepSeek V4、MiniMax M3 などはオープンウェイトを提供し、企業は自前デプロイでデータプライバシー懸念を解消できます——詳細は ds4 ローカル推論 Runbook を参照してください
ダラスの開発者のスタック例:「複雑タスクは Claude + ChatGPT で月約500ドル、日常コーディングと音声認識は MiniMax + Kimi + MiMo で月約200ドル—— workload の90% は安いルート。」

03シナリオ別最適選択クイックリファレンス(2026年6月版)

シナリオ推奨モデル理由
複雑コード / AgentClaude Opus 4.8総合能力首位、長コンテキストで突出
日常プログラミング補助DeepSeek V4 Flash / MiMo-V2.5コスパ極めて高く、速度も速い
超高コスパ APIMiniMax M3$0.60/M、オープンウェイト、自前デプロイ可
長コンテキスト処理Kimi K2.6(1M context)超長ウィンドウ、価格も妥当
Google エコシステム統合Gemini 3.5 FlashGoogle Workspace ネイティブ対応
リアルタイム Web 検索Grok 4.3X/Twitter のリアルタイムコンテンツ取得
自前ローカルデプロイGLM 5.2 / Kimi K2.6トップクラスのオープンウェイト
画像生成ChatGPT Images 2.0テキスト描画が最強
日常対話の総合用途GPT-5.5GPT-5.3 比で幻覚52.5%減、エコシステムが成熟

04下半期予測:Q3「モデル大爆発シーズン」と五大マクロトレンド

Q3 2026 は AI 史上、モデルリリースが最も密集する四半期になる可能性が高いです。現時点で信頼度の高い予測は以下のとおりです。

モデルベンダー予想時期核心ポイント
GPT-6OpenAI2026年8–9月より長いコンテキスト(噂では1.5M token)、Agent 能力強化
Claude Opus 5Anthropic2026年9月前後Opus 4.8 の後継、長時間 Agent タスクを全面強化
Gemini 4Google2026年 Q3マルチモーダル強化、動画理解・音声入力を拡充
DeepSeek V5DeepSeek2026年 Q3オープンウェイト、参数量1T超見込み、閉源フロンティアに対抗
GLM 5.2智谱 Z.aiリリース済み現時点のトップオープンウェイトの一つ、プログラミングが強い
Grok 4.3+xAI2026年 Q31M コンテキスト、リアルタイム Web 強化

うち3モデルは 8月中旬から9月下旬の6週間 に集中リリースされる見込みです——ベンチ王座の入れ替わりは、どのメディアサイクルより速く進むでしょう。

五大マクロトレンドの予測:

  • 競争軸が「誰が最強か」から「誰がこのシナリオに最適か」へ:五大ラボが90日以内に密集リリースする中、閉源フロンティアで最難5%を処理し、中国オープンウェイトで残り95%の日常量を担うのが合理的です。
  • 中国モデルシェアはさらに上昇、エンタープライズコンプラが上限:個人開発者の OpenRouter 占比は70%超もあり得ますが、Fortune 500 調達は30%超は難しい見通しです。
  • Agent が真の戦場:2026年は「Agent が実験から本番へ移行する元年」と定義されています。SWE-bench Pro、OSWorld-Verified、長期タスク完了率がエンタープライズ受注を左右します。
  • OpenAI と Anthropic の双方 IPO の影響:6月の IPO 意向報道は AI セクターの再評価を促し、上場後の商業圧力で価格透明化と中国モデルとの値下げ競争が加速する可能性があります——Anthropic IPOOpenAI 資金調達 を参照してください。
  • ローカル実行が消費者向けハードで SWE-bench 80% を突破:2027年内に、32GB 級 GPU 上のローカルモデルが SWE-bench Verified 80% のプログラミング能力閾値を超える見込みです。

05結語:利益圧縮と米国ベンダーの三つの分化路線

この物語の本質は、AI モデル層の利益が急速に圧縮されている ことです。DeepSeek の2025年初頭の登場は、十分に効率的なアーキテクチャなら頂点モデルに頂点算力は不要だと示しました。小米・腾讯・MiniMax・Moonshot が追随し、「基礎価格」を底値まで押し下げています——「十分良い」層はプレミアム層より 8–30倍 安く、多くの本番ワークロードは「十分良い」で問題なく回ります。

米国ベンダーの対応も三方向に分化しています。

  • OpenAI はエコシステム(プラグイン、エンタープライズ統合、DALL-E、Codex Mobile)に賭けています
  • Anthropic は品質の高地を死守しています(Claude Opus の Agent 能力は依然際立っています)
  • Google は速度とマルチモーダル(Gemini Flash 系列は現在最もコスパの高い閉源選択肢の一つです)

中間の「品質は悪くないが高い」ポジションは急速に消えつつあります。一般の開発者と技術意思決定者にとって今最も価値ある能力は、「最強モデルを選ぶこと」ではなく「いつでもモデルを切り替えられるアーキテクチャを構築すること」 です——今日の首位も、三か月後には変わっているかもしれません。Q3 2026 のリリースラッシュが、それを改めて示すでしょう。

06六ステップ Runbook:クラウド Mac 上でモデル非依存の AI ワークフローを構築する

  1. 01
    タスクを階層化して棚卸し:ワークフローを「フロンティア5%」(Opus 4.8 / GPT-5.5)と「日常95%」(DeepSeek V4 Flash / MiniMax M3 / MiMo-V2.5)に分類します。OpenRouter CLI ツールランキング を参照し、Hermes / Claude Code のルーティング習慣と揃えてください。
  2. 02
    LiteLLM / OpenRouter 統合ゲートウェイを構成:評価ノードで多モデル fallback を設定し、Fable 5 など輸出規制対象モデルには Opus 4.8 代替パスを用意します。
  3. 03
    コンソールでクラウド Mac をプロビジョン:NUKCLOUD コンソールにログインし、ローカルウェイト推論と長時間 Agent セッションには 32 GB 以上 の統一メモリを選択します。料金ページで Kimi K2.6 / GLM 5.2 自ホストスタックを時間課金で試せます。
  4. 04
    TCO モデリング:「全 Claude スタック」vs「Claude フロンティア + 中国モデル日常」vs「独占 Mac 7×24 Agent ホスト」の月額を比較し、IPO 後の tier 値上げも織り込みます。
  5. 05
    コンプラとデータ所在地:エンタープライズ調達では輸出規制と議会審査に合わせてベンダーアンケートを更新します。個人開発者はオープンウェイト自デプロイでプライバシー懸念を優先的に解消できます。
  6. 06
    launchd で 7×24 常駐 Agent:パイロット通過後、注文ページでスペックを確定します。詳細は 本番準備 Runbookヘルプセンター を参照してください。

ローカル MacBook や共有 VPS で多モデル Agent ループを回すと、フタ閉じスリープによる長セッション中断、帯域ジッターによる SSE 断、トークン連動で膨らむ API 請求 がよく起きます。チームが安定した 7×24 オンラインと OpenRouter ルートの即時切替を必要とする場合、NUKCLOUD 多リージョン bare-metal Mac / クラウド Mac ノードは独占テナント境界とスペックの柔軟性の面で Q3 モデル爆発のペースに合わせやすい選択肢です。

07FAQ:OpenRouter 6月ランキングのよくある質問

2026年6月 OpenRouter で最も人気の AI モデルはどれですか?
日次トークン量では DeepSeek V4 Flash が約 619B で首位、続いて腾讯 Hy3 Preview(451B)、MiniMax M3(447B)です。
DeepSeek は Claude より優れていますか?
シナリオ次第です。DeepSeek は使用量とコスパで先行していますが、Claude Opus 4.8 の総合品質指数 61.4 は依然首位で、複雑コードと長コンテキストでは明確に強いです。日常補助は DeepSeek、最難5%は Opus が無難です。
OpenRouter で中国モデルのシェアはどの程度ですか?
Top 10 企業の中国ベンダー週トークン合計は約 46%、開発者トラフィック全体では 60% 超です。米国三社(Google + OpenAI + Anthropic)は2025年6月の約 70% から2026年6月の約 30% へ下落しました。
Claude Fable 5 はどうなりましたか?
Fable 5 は 100/100 の品質評価を獲得していましたが、2026年6月中旬に米国政府の輸出規制により全世界で下架され、現状は未定です。詳細は 規制解説 を参照してください。
2026年 Q3 にリリースされるフロンティアモデルは?
高確度の候補は OpenAI GPT-6(8–9月)、Anthropic Claude Opus 5(約9月)、Google Gemini 4、DeepSeek V5(オープンウェイト、約1T パラメータ)、xAI Grok 4.3+ です。
MiniMax M3 API は使う価値がありますか?
入力 $0.60/M で Claude Opus 4.8 の約1/8、オープンウェイトで自デプロイ可能です。超高コスパの本番 API と日常プログラミング補助に適しています。
2026年、プログラミングに最適な AI は?
複雑 Agent / 長コンテキスト:Claude Opus 4.8。日常補完:DeepSeek V4 Flash または MiMo-V2.5。コスパ API:MiniMax M3。Verified プログラミングベンチ:Claude Sonnet 4.6(SWE-bench Verified 80.8%)。
なぜ単一モデルに一本化すべきではないのですか?
Q3 の6週間で複数フロンティアが集中リリースし、輸出規制・IPO 価格・値下げ競争が可用性とコストを変えます。最も価値あるのはモデル非依存のルーティングアーキテクチャであり、単一ベンダーへのロックインではありません。

本記事は2026年7月1日執筆、データは2026年6月末時点です。投資助言ではありません。外部参考:OpenRouter RankingsArtificial AnalysisAnthropic 2026 Agent レポート