MMLU や SWE-Bench が毎週更新される一方で、来月の API 請求を実際に左右するのは OpenRouter 上の週間ローリング・トークンスループットです。本記事はモデル調達を検討し、Cursor / Claude Code / 自社 Agent を組む開発者と Tech Lead 向けに、① なぜ「払った金額」が発表会スコアより信頼できるか、② OpenRouter Rankings 2026年5月18–24日の週間データに基づく全球 Top 10、③ 米中トラフィック構図と Anthropic「プレミアム悖论」、④ 6月トレンド解説 との対照によるシナリオ別ルーティングと NUKCLOUD クラウド Mac 六ステップ実装リストを示します。
00なぜ請求データはベンチマークより正直か
ベンチマーク榜は「ラボで最良だった1回」を測ります。OpenRouter の週間呼び出し量は「今週、全球の開発者が継続して叩いているモデル」を測ります。OpenRouter は中立的 API 集約基盤として 300超のモデル、60超のベンダーを束ね、月間約 100兆トークン、ユーザー 800万超——週(7日ローリング)で集計したスループットは、AI 実装の体温計として定着しつつあります。
1年前の全球週処理量は約 2.4兆トークン。2026年5月第3週は 28.9兆まで伸び、約 12倍です。プログラミング系タスクのシェアは2025年初の約 11% から 50%超へ拡大し、最大の単一用途になりました。「コードが書ける・Agent が回る・安い」が、最も高価な Opus ではなく DeepSeek-V4-Flash が首位である理由を説明します。
OpenRouter と a16z が共同公開した《2025 AI 利用レポート》(約100兆トークンの匿名メタデータ)では、ベンチスコアと実市場シェアはほぼ逆相関と指摘されています。開発者が重視するのは推論コスト、API 安定性、ツール呼び出し成功率です。これは ds4 ローカル推論 で述べた「高頻度は低価格ルート、クリティカルパスは旗艦」と一致します。
痛点榜だけ見て請求を見ない四つの誤解
- 「月累計」を「週の爆発」と混同:OpenRouter は複数の時間窓を並列表示します。週榜は最新のルーティング移行を反映し、月榜は Hy3 限免終了などを平滑化します。調達レビューは週口径で追うべきです。
- トークンシェアとドル収入を無視:Anthropic のトークンシェアは約 12%(1年前約25%)まで低下した一方、ドル収入シェアは約 46%を維持——高単価閉源は「流量は負け、収入は負けていない」状態です。
- 首位=万能チャンピオンと決めつけ:V4-Flash の首位は Agent ワークフローの費用対効果(入力約 $0.14/M、出力約 $0.28/M)によるもので、GPQA 最高得点ではありません。複雑推論は Opus / Gemini 旗艦でスポット検証が必要です。
- モデルルーティングとホストを切り離す:週榜上位は高スループット Agent 向けが多く、ゲートウェイが超売り VPS 上にあると長接続リセットがモデル ID 変更より先にプロジェクトを止めます。Agent には監査可能な 7×24 macOS 算力が要り、「最安 Linux レンタル」とは別ルートです。
01データ出所:週統計の定義と全球総量
本記事の数値は openrouter.ai/rankings 公開榜に基づきます。集計は週(7日ローリング・トークンスループット)、ノードは 2026年5月18日–5月24日です。次元は週トークン総量(入力+出力)、モデル別順位、ベンダーシェア、ドル収入シェアとトークンシェアの対照を含みます。
| 指標 | データ | 前週比 |
|---|---|---|
| 全球週呼び出し量 | 28.9兆トークン | +7.4%(5週連続上昇) |
| 中国モデル週呼び出し量 | 9.223兆トークン | +19.89% |
| 米国モデル週呼び出し量 | 4.93兆トークン | +16.27% |
| 米中週流量比較 | 中国が4週連続で米国超え | 中国モデル全球シェア約45%+ |
中国モデル流量の時系列も技術レビューに書く価値があります。2025年初は 2%未満、2026年2月に初めて週流量で米国超え、2026年5月は4週連続で全球首位です。単一モデルの偶然ではなく、DeepSeek、Tencent、MiniMax、StepFun など複数の低価格 MoE が共同で押し上げた結果です。
02直近1週間のモデル呼び出し量 Top 10
| 順位 | モデル | ベンダー | 週トークン量 | 前週比 | 特徴 |
|---|---|---|---|---|---|
| 1 | DeepSeek-V4-Flash | DeepSeek(中国) | 3.43T | +66% | Agent ワークフロー向け、極低価格・1M コンテキスト |
| 2 | 腾讯 Hy3 Preview | Tencent(中国) | 3.07T | +16% | 限免終了後も高成長 |
| 3 | Claude Sonnet 4.6 | Anthropic(米国) | 1.35T | — | 百万コンテキスト、企業コーディング主力 |
| 4 | DeepSeek-V3.2 | DeepSeek(中国) | 1.31T | — | 低価格ロングテール、ロールプレイ活発 |
| 5 | Owl Alpha | OpenRouter | 1.15T | +29% | 無料 Agent 特化、百万コンテキスト |
| 6 | Gemini 3 Flash Preview | Google(米国) | 1.06T | — | マルチモーダル、学術・医療向け |
| 7 | DeepSeek-V4-Pro | DeepSeek(中国) | 1.00T | — | 矩陣旗艦(系列合計約5.74T) |
| 8 | MiniMax M2.7 | MiniMax(中国) | 806B | — | 長コンテキストの費用対効果 |
| 9 | Grok 4.1 Fast | xAI(米国) | 721B | — | 2M コンテキスト、法務シーン |
| 10 | Step 3.5 Flash | StepFun(中国) | 673B | — | 高速低価格、バッチ処理 |
DeepSeek の3モデル(V4-Flash、V4-Pro、V3.2)が同時にトップ9入りし、系列週呼び出し合計は約 5.74兆トークン、前週比約 +25.9%、ベンダー首位は2週連続です。Kimi K2.6 は前週6位から圏外へ——週榜はルーティング移行に極めて敏感で、四半期固定ではなく週次で見直す必要があります。
- 引用データ 1:全球週呼び出し 28.9T、1年前の週規模比で約 12倍成長。
- 引用データ 2:DeepSeek-V4-Flash 単体 3.43T/週、前週比 +66%、当週全球の約 11.9%。
- 引用データ 3:Anthropic トークンシェア約 12% vs ドル収入シェア約 46%;Claude Opus 4.6 の月収は約 2,500万ドル級だがトークン量は DeepSeek 矩陣を大きく下回る。
- 引用データ 4:OpenRouter 上のプログラミング流量は 50%超(2025年初約11%)——首位が Flash 系になる背景を説明する。
03トークン量 vs ドル収入:ベンダーの「二重の真実」
| 層 | 代表モデル | トークン特性 | 収入特性 | 典型シーン |
|---|---|---|---|---|
| 高価値・低流量 | Claude Opus 系列 | シェア低下 | ドル収入は依然高シェア | 企業複雑推論、コンプラ調達 |
| 費用対効果・中流量 | Gemini 3 Flash | 安定成長 | 中程度単価 | マルチモーダル、学術、Google エコ |
| 極低価格・高流量 | DeepSeek / MiniMax / StepFun | 週榜を支配 | 極低単価・規模勝負 | Agent、コーディング、バッチ |
Anthropic の「プレミアム悖论」は2026年の調達会議で頻出です。企業は依然 Claude に高単価を払いますが、流量の主導権は中国発オープンソース矩陣へ傾いています。DeepSeek は2026年5月22日、V4-Pro API を恒久的に定価の4分の1へ値下げ(プロモ終了後適用)と発表し、価格戦争を短期補助から長期常態へ移しました。これが V4-Flash の週比 +66% に直結しています。
エンジニアリングチームにとって、デフォルトルートは週トークン榜(節約・エコシステム追従)、クリティカル上限はベンチ+企業 SLA(品質担保)に合わせるべきです。どちらか一方だけでは、月末請求か本番障害のどちらかで代償を払います。
04六ステップ Runbook:週榜ルーティング+クラウド Mac Agent ホスト
週榜は「今週、全球が何を使っているか」を答えます。Runbook はさらに「ゲートウェイと Runner をどこに置くか」を答える必要があります。NUKCLOUD 独占 Apple Silicon では OpenRouter で幅を取り、インスタンス内に Agent ゲートウェイと任意のローカル推論を置き、Cursor Agent Skill ライブラリと揃える構成を推奨します。
-
01
月榜だけでなく週榜を購読:毎週月曜に OpenRouter Rankings を開き、モデル次元とベンダーシェアのスクリーンショットをアーカイブ。Hy3、Owl Alpha など新規トップ10入りを「観察リスト」に追加し、2週間で持続性を検証します。
-
02
シナリオ別デフォルトルート:Agent / バッチ / 下書き → DeepSeek-V4-Flash;企業複雑推論 → Claude Sonnet 4.6 / Opus;マルチモーダル → Gemini 3 Flash;実験 → Owl Alpha(非機密リポジトリ限定)。OpenRouter または自前ゲートウェイで fallback とタスク別トークン上限を設定します。
-
03
請求とトークンシェアを突合:毎月 OpenRouter 請求の「ドル支出 Top 3」と榜の「トークンシェア Top 3」を比較。支出が高価格閉源に偏り流量が Flash へ移行済みなら、ルーティング比率を即調整し「流量は変わったが請求は変わらない」状態を防ぎます。
- 04
-
05
常駐ゲートウェイを配置:インスタンスで Hermes / OpenClaw / 自社ゲートウェイを launchd 常駐。Cursor と Claude Code の Base URL を社内 OpenRouter プロキシへ向け、繰り返し Prompt を SKILL.md に集約し、モデル切替時の指示ドリフトを抑えます。
-
06
隔週レビュー:週榜変化に合わせデフォルトモデル ID を調整。API 月支出が高メモリ Mac レンタル+機密コードを上回るなら V4-Pro 自ホスト+独占 Mac を検討。7×24 オンラインのみならネット安定とメモリ余量を最優先。費用評価は 料金ページ参照。
分単位共有 macOS VPS では帯域ジッター、超売り、長接続リセットが起きやすく、数千ツール呼び出し・12時間バックグラウンド Agent には致命的です。監査可能な本番プレーンには NUKCLOUD 多リージョン bare-metal Mac / クラウド Mac ノードの独占セマンティクスが調達・コンプラ文書と揃いやすいです。