當 MMLU、SWE-Bench 榜單每週刷新時,真正決定你下個月 API 帳單的,是 OpenRouter 上按週滾動的 Token 吞吐量。本文面向正在評審模型採購、搭建 Cursor / Claude Code / 自研 Agent 的開發者與 Tech Lead:① 說明為何「花出去的錢」比發表會跑分更可信;② 依 OpenRouter Rankings 2026 年 5 月 18–24 日週度資料解讀全球 Top 10;③ 拆解中美流量格局與 Anthropic「溢價悖論」;④ 對照 6 月趨勢解讀 給出按場景路由與 NUKCLOUD 雲端 Mac 六步落地清單。
00為什麼帳單資料比 Benchmark 更誠實?
基準測試排行榜衡量的是「實驗室裡最好的一次」;OpenRouter 週呼叫量排行衡量的是「全球開發者本週願意持續呼叫的模型」。OpenRouter 作為中立 API 聚合平台,接入 300+ 模型、覆蓋 60+ 供應商,平台月流量約 100 兆 Token、使用者超 800 萬——其依週(7 天滾動)彙總的 Token 吞吐量,已成為觀察 AI 真實落地進度的「體溫計」。
一年前 OpenRouter 全球週處理量約 2.4 兆 Token;2026 年 5 月第三週已達 28.9 兆,約 12 倍成長。程式設計類任務佔平台流量比例從 2025 年初約 11% 升至超 50%,成為最大單一用途——這意味著「能寫程式、能跑 Agent、夠便宜」比「榜單分數最高」更能解釋榜首為何是 DeepSeek-V4-Flash 而非最貴的 Opus。
OpenRouter 與 a16z 聯合發布的《2025 AI 使用報告》(基於約 100 兆 Token 匿名中繼資料)指出:基準測試分數與實際市佔幾乎呈反比。開發者更在意推理成本、API 穩定性與工具呼叫成功率;這與我們在 ds4 本機推理 文中討論的「高頻任務走低價路由、關鍵路徑走旗艦」完全一致。
痛點只看榜單、不看帳單的四個誤區
- 把「月累計」當「週爆發」:OpenRouter 同時展示不同時間視窗;週榜反映最新路由遷移,月榜平滑了 Hy3 限免結束等事件。採購評審應鎖定週口徑追蹤爆款。
- 忽視 Token 份額 vs 美元收入:Anthropic Token 份額約 12%(一年前約 25%),美元收入份額仍約 46%——高單價閉源模型「流量輸了、收入沒輸」,兩類指標回答不同問題。
- 預設榜首 = 全能冠軍:V4-Flash 奪冠主因是 Agent 工作流性價比(輸入約 $0.14/M、輸出約 $0.28/M),不是 GPQA 最高分。複雜推理仍應抽檢 Opus / Gemini 旗艦。
- 模型路由與主機脫節:週榜前列模型多面向高吞吐 Agent;若閘道跑在超賣 VPS 上,長連線重置比換模型 ID 更常殺死專案。Agent 需要可稽核的 7×24 macOS 算力,與「租最便宜 Linux」是兩條路線。
01資料來源:週統計口徑與全球總量
本文資料來自 openrouter.ai/rankings 公開排行榜,統計週期為按週(7 天滾動 Token 吞吐量),節點為 2026 年 5 月 18 日–5 月 24 日。維度包括:週 Token 總量(輸入 + 輸出)、模型維度排行、廠商市佔,以及美元收入份額與 Token 份額的對照。
| 指標 | 資料 | 環比 |
|---|---|---|
| 全球週呼叫量 | 28.9 兆 Token | +7.4%(連續五週上漲) |
| 中國模型週呼叫量 | 9.223 兆 Token | +19.89% |
| 美國模型週呼叫量 | 4.93 兆 Token | +16.27% |
| 中美週流量對比 | 中國連續四週超美 | 中國模型全球份額約 45%+ |
中國模型流量佔比時間線同樣值得寫入技術評審:2025 年初不足 2%;2026 年 2 月首次週流量超美;2026 年 5 月已連續四週穩居全球首位。這不是單一模型的偶然爆款,而是 DeepSeek、騰訊、MiniMax、階躍等多款低價 MoE 共同抬升的結果。
02最新一週模型呼叫量 Top 10
| 排名 | 模型 | 廠商 | 週 Token 量 | 環比 | 特點 |
|---|---|---|---|---|---|
| 1 | DeepSeek-V4-Flash | DeepSeek(中國) | 3.43T | +66% | Agent 工作流首選,極低價格、1M 上下文 |
| 2 | 騰訊 Hy3 Preview | Tencent(中國) | 3.07T | +16% | 限免結束後仍高成長 |
| 3 | Claude Sonnet 4.6 | Anthropic(美國) | 1.35T | — | 百萬上下文,企業程式設計主力 |
| 4 | DeepSeek-V3.2 | DeepSeek(中國) | 1.31T | — | 低價長尾,角色扮演活躍 |
| 5 | Owl Alpha | OpenRouter | 1.15T | +29% | 免費 Agent 特化,百萬上下文 |
| 6 | Gemini 3 Flash Preview | Google(美國) | 1.06T | — | 多模態,學術/醫療場景 |
| 7 | DeepSeek-V4-Pro | DeepSeek(中國) | 1.00T | — | 矩陣旗艦(系列合計約 5.74T) |
| 8 | MiniMax M2.7 | MiniMax(中國) | 806B | — | 長上下文性價比 |
| 9 | Grok 4.1 Fast | xAI(美國) | 721B | — | 2M 上下文,法律場景 |
| 10 | Step 3.5 Flash | StepFun(中國) | 673B | — | 快速低價,批次處理 |
DeepSeek 三款模型(V4-Flash、V4-Pro、V3.2)同時進入前九,系列週呼叫合計約 5.74 兆 Token,環比約 +25.9%,連續兩週廠商排名第一。Kimi K2.6 前一週排名第 6,當週跌出前十——說明週榜對「路由遷移」極其敏感,須按週複盤而非季度固化策略。
- 可引用資料點 1:全球週呼叫量 28.9T,同比一年前平台週規模成長約 12 倍。
- 可引用資料點 2:DeepSeek-V4-Flash 單模型 3.43T / 週,環比 +66%,佔當週全球總量約 11.9%。
- 可引用資料點 3:Anthropic Token 份額約 12% vs 美元收入份額約 46%;Claude Opus 4.6 月收入約 $2500 萬 量級,但 Token 量遠低於 DeepSeek 矩陣。
- 可引用資料點 4:OpenRouter 平台程式設計類任務流量佔比已超 50%(2025 年初約 11%),解釋榜首多為「夠快夠便宜」的 Flash 系模型。
03Token 量 vs 美元收入:廠商「雙重真相」
| 分層 | 代表模型 | Token 特徵 | 收入特徵 | 典型場景 |
|---|---|---|---|---|
| 高價值·低流量 | Claude Opus 系列 | 份額下滑 | 美元收入仍佔近半 | 企業複雜推理、合規採購 |
| 性價比·中流量 | Gemini 3 Flash | 穩定成長 | 中等單價 | 多模態、學術、Google 生態 |
| 極低價·高流量 | DeepSeek / MiniMax / StepFun | 週榜主導 | 單價極低、靠規模 | Agent、程式設計、批次處理 |
Anthropic 的「溢價悖論」是 2026 年採購會議上的高頻議題:企業使用者仍為 Claude 支付高價,但流量主導權已向中國開源矩陣傾斜。DeepSeek 於 2026 年 5 月 22 日宣布 V4-Pro API 永久調價至原價四分之一(促銷結束後生效),把價格戰從短期補貼變為長期常態——這直接反映在 V4-Flash +66% 的週環比上。
對工程團隊而言:預設路由應跟週 Token 榜(省錢、跟生態);關鍵任務上限應跟Benchmark + 企業 SLA(保質)。兩類指標缺一不可——只看其一,就會在月末帳單或生產故障裡付出代價。
04六步 Runbook:按週榜路由 + 雲端 Mac Agent 主機
週榜回答「本週全球開發者在用什麼」;你的 Runbook 還要回答「閘道與 Runner 放哪」。建議在 NUKCLOUD 獨佔 Apple Silicon 上分層:OpenRouter 做廣度路由,實例內跑 Agent 閘道與可選本機推理,並與 Cursor Agent Skill 庫對齊。
-
01
訂閱週榜而非只看月榜:每週一造訪 OpenRouter Rankings,匯出模型維度與廠商份額截圖存檔;將 Hy3、Owl Alpha 等新進前十模型加入「觀察清單」,兩週內驗證是否持續。
-
02
按場景設預設路由:Agent / 批次 / 草稿 → DeepSeek-V4-Flash;企業複雜推理 → Claude Sonnet 4.6 / Opus;多模態 → Gemini 3 Flash;實驗 → Owl Alpha(僅限非敏感儲存庫)。在 OpenRouter 或自建閘道配置 fallback 與單任務 Token 上限。
-
03
對齊帳單與 Token 份額:每月對比 OpenRouter 帳單中「美元支出 Top 3」與排行榜「Token 份額 Top 3」;若支出集中在高價閉源而流量已遷移到 Flash,立即調整路由比例,避免「流量變了、帳單沒變」。
- 04
-
05
部署常駐閘道:在實例上配置 Hermes / OpenClaw / 自研閘道的 launchd;Cursor 與 Claude Code 的 Base URL 指向內網 OpenRouter 代理。將重複 Prompt 沉澱為 SKILL.md,減少多模型切換時的指令漂移。
-
06
雙週複盤:對照週榜變化調整預設模型 ID;若 API 月支出持續高於高記憶體 Mac 租用且含敏感程式碼,評估 V4-Pro 自託管 + 獨佔 Mac;若僅需 7×24 上線,優先保證網路穩定與記憶體餘量。費用評審見 定價頁。
共享分鐘池式 macOS VPS 常見頻寬抖動、超賣與長連線重置,對「數千次工具呼叫、12 小時背景 Agent」尤其致命。需要可稽核生產平面時,NUKCLOUD 多區域裸機 Mac / 雲端 Mac 節點在獨佔語意與規格彈性上更易與採購、合規文件對齊。