OpenRouter 最新模型週調用量排行:帳單資料不會說謊,誰才是真正的王者?

OpenRouter 依週(7 天滾動)統計的 2026 年 5 月 18–24 日資料顯示:全球週呼叫量達 28.9 兆 Token(環比 +7.4%),DeepSeek-V4-Flash3.43T 居首;中國模型週流量連續四週超美——本文用帳單口徑拆解 Top 10、廠商溢價悖論與選型 Runbook。

當 MMLU、SWE-Bench 榜單每週刷新時,真正決定你下個月 API 帳單的,是 OpenRouter 上按週滾動的 Token 吞吐量。本文面向正在評審模型採購、搭建 Cursor / Claude Code / 自研 Agent 的開發者與 Tech Lead:① 說明為何「花出去的錢」比發表會跑分更可信;② 依 OpenRouter Rankings 2026 年 5 月 18–24 日週度資料解讀全球 Top 10;③ 拆解中美流量格局與 Anthropic「溢價悖論」;④ 對照 6 月趨勢解讀 給出按場景路由NUKCLOUD 雲端 Mac 六步落地清單。

00為什麼帳單資料比 Benchmark 更誠實?

基準測試排行榜衡量的是「實驗室裡最好的一次」;OpenRouter 週呼叫量排行衡量的是「全球開發者本週願意持續呼叫的模型」。OpenRouter 作為中立 API 聚合平台,接入 300+ 模型、覆蓋 60+ 供應商,平台月流量約 100 兆 Token、使用者超 800 萬——其依週(7 天滾動)彙總的 Token 吞吐量,已成為觀察 AI 真實落地進度的「體溫計」。

一年前 OpenRouter 全球週處理量約 2.4 兆 Token;2026 年 5 月第三週已達 28.9 兆,約 12 倍成長。程式設計類任務佔平台流量比例從 2025 年初約 11% 升至超 50%,成為最大單一用途——這意味著「能寫程式、能跑 Agent、夠便宜」比「榜單分數最高」更能解釋榜首為何是 DeepSeek-V4-Flash 而非最貴的 Opus。

OpenRouter 與 a16z 聯合發布的《2025 AI 使用報告》(基於約 100 兆 Token 匿名中繼資料)指出:基準測試分數與實際市佔幾乎呈反比。開發者更在意推理成本、API 穩定性與工具呼叫成功率;這與我們在 ds4 本機推理 文中討論的「高頻任務走低價路由、關鍵路徑走旗艦」完全一致。

痛點只看榜單、不看帳單的四個誤區

  • 把「月累計」當「週爆發」:OpenRouter 同時展示不同時間視窗;週榜反映最新路由遷移,月榜平滑了 Hy3 限免結束等事件。採購評審應鎖定週口徑追蹤爆款。
  • 忽視 Token 份額 vs 美元收入:Anthropic Token 份額約 12%(一年前約 25%),美元收入份額仍約 46%——高單價閉源模型「流量輸了、收入沒輸」,兩類指標回答不同問題。
  • 預設榜首 = 全能冠軍:V4-Flash 奪冠主因是 Agent 工作流性價比(輸入約 $0.14/M、輸出約 $0.28/M),不是 GPQA 最高分。複雜推理仍應抽檢 Opus / Gemini 旗艦。
  • 模型路由與主機脫節:週榜前列模型多面向高吞吐 Agent;若閘道跑在超賣 VPS 上,長連線重置比換模型 ID 更常殺死專案。Agent 需要可稽核的 7×24 macOS 算力,與「租最便宜 Linux」是兩條路線。

01資料來源:週統計口徑與全球總量

本文資料來自 openrouter.ai/rankings 公開排行榜,統計週期為按週(7 天滾動 Token 吞吐量),節點為 2026 年 5 月 18 日–5 月 24 日。維度包括:週 Token 總量(輸入 + 輸出)、模型維度排行、廠商市佔,以及美元收入份額與 Token 份額的對照。

指標資料環比
全球週呼叫量28.9 兆 Token+7.4%(連續五週上漲)
中國模型週呼叫量9.223 兆 Token+19.89%
美國模型週呼叫量4.93 兆 Token+16.27%
中美週流量對比中國連續四週超美中國模型全球份額約 45%+

中國模型流量佔比時間線同樣值得寫入技術評審:2025 年初不足 2%;2026 年 2 月首次週流量超美;2026 年 5 月已連續四週穩居全球首位。這不是單一模型的偶然爆款,而是 DeepSeek、騰訊、MiniMax、階躍等多款低價 MoE 共同抬升的結果。

02最新一週模型呼叫量 Top 10

排名模型廠商週 Token 量環比特點
1DeepSeek-V4-FlashDeepSeek(中國)3.43T+66%Agent 工作流首選,極低價格、1M 上下文
2騰訊 Hy3 PreviewTencent(中國)3.07T+16%限免結束後仍高成長
3Claude Sonnet 4.6Anthropic(美國)1.35T百萬上下文,企業程式設計主力
4DeepSeek-V3.2DeepSeek(中國)1.31T低價長尾,角色扮演活躍
5Owl AlphaOpenRouter1.15T+29%免費 Agent 特化,百萬上下文
6Gemini 3 Flash PreviewGoogle(美國)1.06T多模態,學術/醫療場景
7DeepSeek-V4-ProDeepSeek(中國)1.00T矩陣旗艦(系列合計約 5.74T)
8MiniMax M2.7MiniMax(中國)806B長上下文性價比
9Grok 4.1 FastxAI(美國)721B2M 上下文,法律場景
10Step 3.5 FlashStepFun(中國)673B快速低價,批次處理

DeepSeek 三款模型(V4-Flash、V4-Pro、V3.2)同時進入前九,系列週呼叫合計約 5.74 兆 Token,環比約 +25.9%,連續兩週廠商排名第一。Kimi K2.6 前一週排名第 6,當週跌出前十——說明週榜對「路由遷移」極其敏感,須按週複盤而非季度固化策略。

  • 可引用資料點 1:全球週呼叫量 28.9T,同比一年前平台週規模成長約 12 倍
  • 可引用資料點 2:DeepSeek-V4-Flash 單模型 3.43T / 週,環比 +66%,佔當週全球總量約 11.9%
  • 可引用資料點 3:Anthropic Token 份額約 12% vs 美元收入份額約 46%;Claude Opus 4.6 月收入約 $2500 萬 量級,但 Token 量遠低於 DeepSeek 矩陣。
  • 可引用資料點 4:OpenRouter 平台程式設計類任務流量佔比已超 50%(2025 年初約 11%),解釋榜首多為「夠快夠便宜」的 Flash 系模型。

03Token 量 vs 美元收入:廠商「雙重真相」

分層代表模型Token 特徵收入特徵典型場景
高價值·低流量Claude Opus 系列份額下滑美元收入仍佔近半企業複雜推理、合規採購
性價比·中流量Gemini 3 Flash穩定成長中等單價多模態、學術、Google 生態
極低價·高流量DeepSeek / MiniMax / StepFun週榜主導單價極低、靠規模Agent、程式設計、批次處理

Anthropic 的「溢價悖論」是 2026 年採購會議上的高頻議題:企業使用者仍為 Claude 支付高價,但流量主導權已向中國開源矩陣傾斜。DeepSeek 於 2026 年 5 月 22 日宣布 V4-Pro API 永久調價至原價四分之一(促銷結束後生效),把價格戰從短期補貼變為長期常態——這直接反映在 V4-Flash +66% 的週環比上。

對工程團隊而言:預設路由應跟週 Token 榜(省錢、跟生態);關鍵任務上限應跟Benchmark + 企業 SLA(保質)。兩類指標缺一不可——只看其一,就會在月末帳單或生產故障裡付出代價。

04六步 Runbook:按週榜路由 + 雲端 Mac Agent 主機

週榜回答「本週全球開發者在用什麼」;你的 Runbook 還要回答「閘道與 Runner 放哪」。建議在 NUKCLOUD 獨佔 Apple Silicon 上分層:OpenRouter 做廣度路由,實例內跑 Agent 閘道與可選本機推理,並與 Cursor Agent Skill 庫對齊。

  1. 01
    訂閱週榜而非只看月榜:每週一造訪 OpenRouter Rankings,匯出模型維度與廠商份額截圖存檔;將 Hy3、Owl Alpha 等新進前十模型加入「觀察清單」,兩週內驗證是否持續。
  2. 02
    按場景設預設路由:Agent / 批次 / 草稿 → DeepSeek-V4-Flash;企業複雜推理 → Claude Sonnet 4.6 / Opus;多模態 → Gemini 3 Flash;實驗 → Owl Alpha(僅限非敏感儲存庫)。在 OpenRouter 或自建閘道配置 fallback 與單任務 Token 上限。
  3. 03
    對齊帳單與 Token 份額:每月對比 OpenRouter 帳單中「美元支出 Top 3」與排行榜「Token 份額 Top 3」;若支出集中在高價閉源而流量已遷移到 Flash,立即調整路由比例,避免「流量變了、帳單沒變」。
  4. 04
    撥備獨佔雲端 Mac:控制台 完成區域、SSH 與租戶邊界;Agent 長連線與 GitHub Runner 需要不被超賣踢下線的主機。規格見 下單頁:僅 API 閘道用標準檔;本機 ds4 / 長 KV 用 96GB+ 統一記憶體。
  5. 05
    部署常駐閘道:在實例上配置 Hermes / OpenClaw / 自研閘道的 launchd;Cursor 與 Claude Code 的 Base URL 指向內網 OpenRouter 代理。將重複 Prompt 沉澱為 SKILL.md,減少多模型切換時的指令漂移。
  6. 06
    雙週複盤:對照週榜變化調整預設模型 ID;若 API 月支出持續高於高記憶體 Mac 租用且含敏感程式碼,評估 V4-Pro 自託管 + 獨佔 Mac;若僅需 7×24 上線,優先保證網路穩定與記憶體餘量。費用評審見 定價頁

共享分鐘池式 macOS VPS 常見頻寬抖動、超賣與長連線重置,對「數千次工具呼叫、12 小時背景 Agent」尤其致命。需要可稽核生產平面時,NUKCLOUD 多區域裸機 Mac / 雲端 Mac 節點在獨佔語意與規格彈性上更易與採購、合規文件對齊。

05常見問題

OpenRouter 週榜與 6 月 4 日那篇趨勢文的資料為何不同?
統計時間視窗不同:本文鎖定 2026 年 5 月 18–24 日週滾動口徑;趨勢文採用 6 月初另一時間切片。OpenRouter 即時更新,請以官網當前週榜為準,並固定口徑做縱向對比。
榜首是 V4-Flash,是否意味著 Opus 可以下線?
不建議。週榜反映流量,Opus 仍適合關鍵路徑複雜推理。典型做法是 80% 流量走 V4-Flash,20% 走 Sonnet / Opus 做抽檢與合併。
Anthropic Token 份額下滑,企業合約還能簽嗎?
能。美元收入份額仍高說明付費意願仍在;Token 下滑說明高頻任務已遷移到低價模型。企業合約應區分「旗艦 SLA」與「預設路由」兩檔,分別定價。
免費 Owl Alpha 能用於公司程式碼庫嗎?
不建議用於敏感資料。免費或 Stealth 模型可能記錄 Prompt。公司場景請用私有化 Hy3 / V4-Pro 或閉源企業 API,並把推理放在獨佔實例上。
週榜變化快,Mac 主機要不要跟著換?
不必。主機看Agent 上線率、記憶體與 Xcode/簽章需求;模型路由在閘道層按週調整即可。Mac 規格按 96GB / 128GB 等記憶體檔位升級,比追新晶片更划算。