OpenRouter 最新モデル週間トークンランキング:請求データは嘘をつかない、誰が真の王者か?

OpenRouter の週間(7日ローリング)統計、2026年5月18–24日では全球週呼び出しが 28.9兆トークン(前週比 +7.4%)、DeepSeek-V4-Flash3.43T で首位。中国モデルは4週連続で米国を上回ります——本記事は請求ベースで Top 10、ベンダープレミアム悖论と選定 Runbook を整理します。

MMLU や SWE-Bench が毎週更新される一方で、来月の API 請求を実際に左右するのは OpenRouter 上の週間ローリング・トークンスループットです。本記事はモデル調達を検討し、Cursor / Claude Code / 自社 Agent を組む開発者と Tech Lead 向けに、① なぜ「払った金額」が発表会スコアより信頼できるか、② OpenRouter Rankings 2026年5月18–24日の週間データに基づく全球 Top 10、③ 米中トラフィック構図と Anthropic「プレミアム悖论」、④ 6月トレンド解説 との対照によるシナリオ別ルーティングNUKCLOUD クラウド Mac 六ステップ実装リストを示します。

00なぜ請求データはベンチマークより正直か

ベンチマーク榜は「ラボで最良だった1回」を測ります。OpenRouter の週間呼び出し量は「今週、全球の開発者が継続して叩いているモデル」を測ります。OpenRouter は中立的 API 集約基盤として 300超のモデル60超のベンダーを束ね、月間約 100兆トークン、ユーザー 800万超——週(7日ローリング)で集計したスループットは、AI 実装の体温計として定着しつつあります。

1年前の全球週処理量は約 2.4兆トークン。2026年5月第3週は 28.9兆まで伸び、約 12倍です。プログラミング系タスクのシェアは2025年初の約 11% から 50%超へ拡大し、最大の単一用途になりました。「コードが書ける・Agent が回る・安い」が、最も高価な Opus ではなく DeepSeek-V4-Flash が首位である理由を説明します。

OpenRouter と a16z が共同公開した《2025 AI 利用レポート》(約100兆トークンの匿名メタデータ)では、ベンチスコアと実市場シェアはほぼ逆相関と指摘されています。開発者が重視するのは推論コスト、API 安定性、ツール呼び出し成功率です。これは ds4 ローカル推論 で述べた「高頻度は低価格ルート、クリティカルパスは旗艦」と一致します。

痛点榜だけ見て請求を見ない四つの誤解

  • 「月累計」を「週の爆発」と混同:OpenRouter は複数の時間窓を並列表示します。週榜は最新のルーティング移行を反映し、月榜は Hy3 限免終了などを平滑化します。調達レビューは週口径で追うべきです。
  • トークンシェアとドル収入を無視:Anthropic のトークンシェアは約 12%(1年前約25%)まで低下した一方、ドル収入シェアは約 46%を維持——高単価閉源は「流量は負け、収入は負けていない」状態です。
  • 首位=万能チャンピオンと決めつけ:V4-Flash の首位は Agent ワークフローの費用対効果(入力約 $0.14/M、出力約 $0.28/M)によるもので、GPQA 最高得点ではありません。複雑推論は Opus / Gemini 旗艦でスポット検証が必要です。
  • モデルルーティングとホストを切り離す:週榜上位は高スループット Agent 向けが多く、ゲートウェイが超売り VPS 上にあると長接続リセットがモデル ID 変更より先にプロジェクトを止めます。Agent には監査可能な 7×24 macOS 算力が要り、「最安 Linux レンタル」とは別ルートです。

01データ出所:週統計の定義と全球総量

本記事の数値は openrouter.ai/rankings 公開榜に基づきます。集計は週(7日ローリング・トークンスループット)、ノードは 2026年5月18日–5月24日です。次元は週トークン総量(入力+出力)、モデル別順位、ベンダーシェア、ドル収入シェアとトークンシェアの対照を含みます。

指標データ前週比
全球週呼び出し量28.9兆トークン+7.4%(5週連続上昇)
中国モデル週呼び出し量9.223兆トークン+19.89%
米国モデル週呼び出し量4.93兆トークン+16.27%
米中週流量比較中国が4週連続で米国超え中国モデル全球シェア約45%+

中国モデル流量の時系列も技術レビューに書く価値があります。2025年初は 2%未満、2026年2月に初めて週流量で米国超え、2026年5月は4週連続で全球首位です。単一モデルの偶然ではなく、DeepSeek、Tencent、MiniMax、StepFun など複数の低価格 MoE が共同で押し上げた結果です。

02直近1週間のモデル呼び出し量 Top 10

順位モデルベンダー週トークン量前週比特徴
1DeepSeek-V4-FlashDeepSeek(中国)3.43T+66%Agent ワークフロー向け、極低価格・1M コンテキスト
2腾讯 Hy3 PreviewTencent(中国)3.07T+16%限免終了後も高成長
3Claude Sonnet 4.6Anthropic(米国)1.35T百万コンテキスト、企業コーディング主力
4DeepSeek-V3.2DeepSeek(中国)1.31T低価格ロングテール、ロールプレイ活発
5Owl AlphaOpenRouter1.15T+29%無料 Agent 特化、百万コンテキスト
6Gemini 3 Flash PreviewGoogle(米国)1.06Tマルチモーダル、学術・医療向け
7DeepSeek-V4-ProDeepSeek(中国)1.00T矩陣旗艦(系列合計約5.74T)
8MiniMax M2.7MiniMax(中国)806B長コンテキストの費用対効果
9Grok 4.1 FastxAI(米国)721B2M コンテキスト、法務シーン
10Step 3.5 FlashStepFun(中国)673B高速低価格、バッチ処理

DeepSeek の3モデル(V4-Flash、V4-Pro、V3.2)が同時にトップ9入りし、系列週呼び出し合計は約 5.74兆トークン、前週比約 +25.9%、ベンダー首位は2週連続です。Kimi K2.6 は前週6位から圏外へ——週榜はルーティング移行に極めて敏感で、四半期固定ではなく週次で見直す必要があります。

  • 引用データ 1:全球週呼び出し 28.9T、1年前の週規模比で約 12倍成長。
  • 引用データ 2:DeepSeek-V4-Flash 単体 3.43T/週、前週比 +66%、当週全球の約 11.9%
  • 引用データ 3:Anthropic トークンシェア約 12% vs ドル収入シェア約 46%;Claude Opus 4.6 の月収は約 2,500万ドル級だがトークン量は DeepSeek 矩陣を大きく下回る。
  • 引用データ 4:OpenRouter 上のプログラミング流量は 50%超(2025年初約11%)——首位が Flash 系になる背景を説明する。

03トークン量 vs ドル収入:ベンダーの「二重の真実」

代表モデルトークン特性収入特性典型シーン
高価値・低流量Claude Opus 系列シェア低下ドル収入は依然高シェア企業複雑推論、コンプラ調達
費用対効果・中流量Gemini 3 Flash安定成長中程度単価マルチモーダル、学術、Google エコ
極低価格・高流量DeepSeek / MiniMax / StepFun週榜を支配極低単価・規模勝負Agent、コーディング、バッチ

Anthropic の「プレミアム悖论」は2026年の調達会議で頻出です。企業は依然 Claude に高単価を払いますが、流量の主導権は中国発オープンソース矩陣へ傾いています。DeepSeek は2026年5月22日、V4-Pro API を恒久的に定価の4分の1へ値下げ(プロモ終了後適用)と発表し、価格戦争を短期補助から長期常態へ移しました。これが V4-Flash の週比 +66% に直結しています。

エンジニアリングチームにとって、デフォルトルートは週トークン榜(節約・エコシステム追従)、クリティカル上限はベンチ+企業 SLA(品質担保)に合わせるべきです。どちらか一方だけでは、月末請求か本番障害のどちらかで代償を払います。

04六ステップ Runbook:週榜ルーティング+クラウド Mac Agent ホスト

週榜は「今週、全球が何を使っているか」を答えます。Runbook はさらに「ゲートウェイと Runner をどこに置くか」を答える必要があります。NUKCLOUD 独占 Apple Silicon では OpenRouter で幅を取り、インスタンス内に Agent ゲートウェイと任意のローカル推論を置き、Cursor Agent Skill ライブラリと揃える構成を推奨します。

  1. 01
    月榜だけでなく週榜を購読:毎週月曜に OpenRouter Rankings を開き、モデル次元とベンダーシェアのスクリーンショットをアーカイブ。Hy3、Owl Alpha など新規トップ10入りを「観察リスト」に追加し、2週間で持続性を検証します。
  2. 02
    シナリオ別デフォルトルート:Agent / バッチ / 下書き → DeepSeek-V4-Flash;企業複雑推論 → Claude Sonnet 4.6 / Opus;マルチモーダル → Gemini 3 Flash;実験 → Owl Alpha(非機密リポジトリ限定)。OpenRouter または自前ゲートウェイで fallback とタスク別トークン上限を設定します。
  3. 03
    請求とトークンシェアを突合:毎月 OpenRouter 請求の「ドル支出 Top 3」と榜の「トークンシェア Top 3」を比較。支出が高価格閉源に偏り流量が Flash へ移行済みなら、ルーティング比率を即調整し「流量は変わったが請求は変わらない」状態を防ぎます。
  4. 04
    独占クラウド Mac を確保:コンソールでリージョン、SSH、テナント境界を完了。Agent 長接続と GitHub Runner は超売りで切断されないホストが要ります。スペックは 注文ページ参照:API ゲートウェイのみなら標準档、ローカル ds4 / 長 KV は 96GB+ 統一メモリ
  5. 05
    常駐ゲートウェイを配置:インスタンスで Hermes / OpenClaw / 自社ゲートウェイを launchd 常駐。Cursor と Claude Code の Base URL を社内 OpenRouter プロキシへ向け、繰り返し Prompt を SKILL.md に集約し、モデル切替時の指示ドリフトを抑えます。
  6. 06
    隔週レビュー:週榜変化に合わせデフォルトモデル ID を調整。API 月支出が高メモリ Mac レンタル+機密コードを上回るなら V4-Pro 自ホスト+独占 Mac を検討。7×24 オンラインのみならネット安定とメモリ余量を最優先。費用評価は 料金ページ参照。

分単位共有 macOS VPS では帯域ジッター、超売り、長接続リセットが起きやすく、数千ツール呼び出し・12時間バックグラウンド Agent には致命的です。監査可能な本番プレーンには NUKCLOUD 多リージョン bare-metal Mac / クラウド Mac ノードの独占セマンティクスが調達・コンプラ文書と揃いやすいです。

05よくある質問

週榜と6月4日のトレンド記事の数値が違うのはなぜですか?
統計時間窓が異なります。本記事は2026年5月18–24日の週ローリングに固定。トレンド記事は6月初の別スライスです。OpenRouter はリアルタイム更新のため、公式の現行週榜を基準に口径を固定して縦比較してください。
首位が V4-Flash なら Opus は廃止できますか?
非推奨です。週榜は流量を示し、Opus はクリティカルパス複雑推論に適します。典型は約80%を V4-Flash、約20%を Sonnet / Opus でスポット検証とマージに回す構成です。
Anthropic のトークンシェア低下でも企業契約は可能ですか?
可能です。ドル収入シェアが高いのは支払意思が残っている証拠。トークン低下は高頻度タスクが低価格モデルへ移った結果です。企業契約は「旗艦 SLA」と「デフォルトルート」の二段で価格設計するのが現実的です。
無料 Owl Alpha を社内コードに使えますか?
機密データには非推奨です。無料・Stealth モデルは Prompt 記録の可能性があります。企業利用は私有化 Hy3 / V4-Pro または閉源エンタープライズ API と独占インスタンスを選んでください。
週榜は変化が速いので Mac ホストも毎週替えますか?
不要です。ホストはAgent 稼働率、メモリ、Xcode/署名要件で判断し、モデルルーティングはゲートウェイ層で週次調整すれば足ります。Mac は 96GB / 128GB などメモリ段階のアップグレードが新チップ追従より費用対効果が高いことが多いです。