当你在 GitHub 上按 Star 数挑选 AI 编程 CLI 时,真正在 OpenRouter 上烧掉万亿 Token 的,可能是另一批工具。本文面向使用 Cursor / Claude Code / Aider / Hermes Agent 的开发者与 Tech Lead:① 说明为何 OpenRouter App 榜 比 Star 数更能反映真实使用强度;② 基于 2026 年 6 月 2–8 日周度数据解读全平台 Top 10 与 CLI 专项榜;③ 横向对比 Kilo Code、Claude Code、Hermes、Aider、Cline、Goose、OpenCode 等七款主流工具;④ 给出按场景选型矩阵与 NUKCLOUD 云端 Mac 六步落地清单。可与 周度模型账单解读、6 月 LLM 趋势 对照阅读。
00为什么 OpenRouter App 榜比 GitHub Stars 更值得信?
GitHub Stars 衡量的是「有人收藏过」;OpenRouter App 排行榜衡量的是「本周真实调用了多少 Token」。作为中立 API 聚合平台,OpenRouter 接入 300+ 模型、覆盖 60+ 供应商,月流量约 100 万亿 Token。接入工具若选择公开追踪,其周 Token 消耗与请求次数对所有人可见——这是目前最可量化的 AI CLI 热度温度计。
与 模型周榜 回答「全球在用什么 LLM」不同,App 榜回答「全球在用什么外壳调用这些模型」。编程类任务已占平台流量超 50%,而 CLI 与 Agent 类工具在本周进一步吞噬 70%+ 的周 Token——说明 2026 年开发者选型重心已从「挑模型」转向「挑 Agent 运行时 + 路由策略」。
OpenRouter 的 BYOK(Bring Your Own Key)模式让费用与直连厂商 API 几乎等价,榜单数据因此更少被「平台补贴」扭曲。对工程团队而言:Star 数适合发现新秀,周 Token 份额适合决定默认工具链;二者背离时,应以账单为准。这与我们在 Cursor Agent Skill 文中强调的「把重复 Prompt 沉淀为 SKILL.md、减少多工具切换漂移」一脉相承——工具选型与主机选型必须一起评审。
痛点只看 Star、不看 Token 的四个误区
- 把 Star 当 DAU:Cline 拥有 58,600+ Star,但 OpenRouter 本周全平台 Top 10 里挤进前列的是 Kilo Code 与 Claude Code——Star 反映社区关注,Token 反映付费意愿与使用深度,采购评审应锁定周口径 App 榜。
- 忽视全平台榜 vs CLI 专项榜差异:Hermes Agent 全平台 #1(4.94T),但 CLI 专项榜排 #3——因其覆盖研究、写作、自动化等多类任务,Token 爆发来自批量脚本而非纯交互式编码;按场景读榜才能避免「榜首万能」错觉。
- 默认开源 = 零成本:多数 CLI 工具虽免费 BYOK,但 Token 账单仍随调用量线性增长。Hermes 本周 4.94T 说明自动化场景可产生巨量消耗;需在 OpenRouter 设单任务 Token 上限与 fallback,而非只看软件授权费。
- CLI 工具与 Mac 主机脱节:Claude Code 沙箱依赖 macOS Seatbelt;Goose 的 Rust 二进制在 Apple Silicon 上性能更优;若网关跑在超卖 Linux VPS 上,长连接重置比换 CLI 更常杀死 Agent 项目。7×24 CLI 工作流需要可审计的 macOS 算力,与「租最便宜云主机」是两条路线。
01数据来源与全平台 Top 10 快照
本文数据来自 openrouter.ai/apps 公开 App 排行榜,统计维度为 This Week(自然周滚动),节点为 2026 年 6 月 2 日–6 月 8 日。仅统计选择公开追踪的应用,非全样本但覆盖主流 CLI 与 Agent 工具。CLI 专项榜在此基础上剔除纯娱乐/非开发类应用,并综合终端可用性、模型兼容性、开发者体验与社区活跃度。
| 全平台排名 | 工具 | 类型 | 本周 Token 量 | 备注 |
|---|---|---|---|---|
| 1 | Hermes Agent | AI Agent(CLI/个人) | 4.94T | 全平台第一,开源零门槛 |
| 2 | OpenClaw | AI Agent(通用) | 1.26T | 与 Kilo Code 周量接近 |
| 3 | Kilo Code | CLI / IDE 插件 | 1.22T | CLI 专项榜 #1 |
| 4 | Claude Code | CLI(终端原生) | 606B | 闭源推理天花板 |
| 5 | Descript | AI 视频/播客 | 454B | 非开发类 |
| 6 | pi | 编程 AI | 384B | — |
| 7 | Lemonade | Roblox AI | 317B | 非开发类 |
| 8 | Pioneer (production) | 推理 API | 268B | — |
| 9 | GitLawb | 区块链协作 | 253B | 非开发类 |
| 10 | Janitor AI | AI 聊天平台 | 218B | 非开发类 |
本周关键趋势:CLI 与 Agent 类工具合计消耗约 70%+ 的周 Token;Kilo Code 与 Claude Code 双双挤进全平台 Top 5,是代码类 CLI 的双雄。Hermes 以近 4 倍于第二名 OpenClaw 的 Token 量领跑,体现其在自动化与个人 Agent 场景中的极高渗透率。非开发类工具(Descript、Lemonade、Janitor AI)仍上榜,说明 OpenRouter 用户群已超越纯开发者圈层。
- 可引用数据点 1:Hermes Agent 本周 4.94T Token,约为第二名 OpenClaw(1.26T)的 3.9 倍。
- 可引用数据点 2:Kilo Code 1.22T 与 OpenClaw 1.26T 仅差 40B,CLI 与通用 Agent 使用深度已同一量级。
- 可引用数据点 3:CLI + Agent 工具占本周平台 Token 70%+,编程任务占全平台流量已超 50%(见 趋势解读)。
02CLI 工具专项榜 Top 10
以下为剔除非开发类应用后的 CLI 专项排行,综合本周实时数据、近 30 日累计表现与功能完整度。排名与全平台榜不完全一致——Hermes 虽全平台第一,但在「纯 CLI 编码工作流」语境下,Kilo Code 与 Claude Code 的开发者渗透率更集中。
| CLI 排名 | 工具 | 全平台本周 | 本周 Token | 开源 | 核心亮点 |
|---|---|---|---|---|---|
| 1 | Kilo Code | #3 | 1.22T | ✅ | 500+ 模型,Architect/Code/Debug/Orchestrator 四模式 |
| 2 | Claude Code | #4 | 606B | ❌ | 终端原生,Sub-agent 编排,Seatbelt 沙箱 |
| 3 | Hermes Agent | #1 | 4.94T | ✅ | 完全开源,多平台网关,自动化批量场景 |
| 4 | Aider | 榜外 | ~2.4B/月 | ✅ | Git 原生最强,Tree-sitter Repo Map,41,200+ Star |
| 5 | Cline | 榜外 | ~140B/月 | ✅ | 逐步审批哲学,浏览器自动化,58,600+ Star |
| 6 | Goose | 榜外 | ~46.4B/月 | ✅ | MCP 原生 1,700+ 服务,Recipes 工作流,Rust 构建 |
| 7 | OpenCode | 榜外 | 快速增长 | ✅ | 75+ 提供商,97,500+ Star,增速最快 |
| 8 | OpenAI Codex CLI | 榜外 | ~91B/月 | ✅ | 云端沙箱,~1000 Token/秒,Headless CI |
| 9 | Roo Code | 榜外 | ~111.8B/月 | ✅ | Cline 增强 Fork,Boomerang 子任务,任务看板 |
| 10 | Qwen Code | 榜外 | ~39.9M/月 | ✅ | 阿里出品,中英双语优化,Qwen2.5-Coder 深度集成 |
Kilo Code 本周 1.22T 与其 VS Code / JetBrains 插件生态、零溢价 BYOK 及四种工作模式直接相关——Architect 负责系统设计,Code 负责文件修改,Debug 定位根因,Orchestrator 协调子任务并行。Claude Code 以 606B 稳居专项榜第二:终端原生、Plan Mode 先规划后执行、CLAUDE.md 项目记忆,以及 macOS Seatbelt 系统级沙箱,是企业复杂重构的首选。Hermes Agent Token 量碾压但专项榜第三,因其用户群包含大量非交互式自动化部署,与「坐在终端里写代码」的使用画像不同。
榜外工具仍值得纳入评审:Aider 是 Git 工作流最成熟的纯 CLI(自动 Commit、Architect 双模型降本);Cline 适合需逐步审计的合规团队;Goose 面向 DevOps 全链路(Issue → PR);OpenCode Star 增速最快,Docker 沙箱 + AGENTS.md 记忆对 CI 友好。OpenRouter 榜外不代表无用——许多团队使用直连 API 或未开启公开追踪,但周榜前列足以指导「默认工具链」方向。
03七款主流 CLI 功能对比矩阵
| 功能特性 | Kilo Code | Claude Code | Hermes Agent | Aider | Cline | Goose | OpenCode |
|---|---|---|---|---|---|---|---|
| 开源 | ✅ | ❌ | ✅ | ✅ | ✅ | ✅ | ✅ |
| MCP 支持 | ✅ | ✅ | ✅ | ❌ | ✅ | ✅ | ✅ |
| 沙箱隔离 | ❌ | ✅ Seatbelt | ❌ | ❌ | 快照回滚 | Docker | Docker |
| Sub-agent | ✅ | ✅ | ✅ | ❌ | ✅ | ✅ | ✅ |
| Plan Mode | ✅ | ✅ | ✅ | ❌ | ✅ | ✅ | ✅ |
| 项目记忆 | ✅ | CLAUDE.md | ✅ | ❌ | .clinerules | .goosehints | AGENTS.md |
| Headless CI | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
| 模型数量 | 500+ | Claude Only | 多模型 | 100+ | 全平台 | 多模型 | 75+ |
| 免费 BYOK | ✅ | ❌ | ✅ | ✅ | ✅ | ✅ | ✅ |
| Git 集成 | ✅ | ✅ | ✅ | ✅✅ | ✅ | ✅ | ✅ |
| 浏览器自动化 | ❌ | ❌ | ❌ | ❌ | ✅ | ❌ | ❌ |
| 语音输入 | ❌ | ❌ | ❌ | ✅ | ❌ | ❌ | ❌ |
| 桌面 GUI | ❌ | ❌ | ❌ | ❌ | ❌ | ✅ | ❌ |
矩阵揭示三条选型规律:① 模型灵活性与推理上限往往互斥——Kilo Code / OpenCode 适合多模型路由,Claude Code 适合关键路径复杂推理;② MCP 已成 2026 年 Agent 标配,仅 Aider 缺席,扩展企业工具链时需额外评估;③ 安全模型分层明显:Claude Code 系统级沙箱 > Cline 逐步审批 > Goose/OpenCode Docker 容器 > 无沙箱开源 CLI。Mac 用户应优先利用 Claude Code 的 Seatbelt 与 Goose 在 Apple Silicon 上的 Rust 性能优势。
04按场景选型指南
| 场景 | 推荐工具 | 理由 | 团队规模 |
|---|---|---|---|
| 日常编码 + Git 历史整洁 | Aider | 自动 Commit、随时回滚,Architect 双模型降本 | 个人 / 小团队 |
| 大型重构 + 预算充足 | Claude Code | 最强推理,Sub-agent 并行,本周 606B 验证认可度 | 中型 / 企业 |
| 最大模型灵活性 | Kilo Code | 500+ 模型,四模式,本周 1.22T 全平台 Top 3 | 小团队 2–10 人 |
| 安全敏感 / 逐步审计 | Cline | 每步确认 + 工作区快照,浏览器自动化 | 合规团队 |
| DevOps / 工具链自动化 | Goose | MCP 原生 1,700+ 服务,Recipes 固化工作流 | Platform 团队 |
| 预算有限 / 7×24 自动化 | Hermes Agent | 完全免费开源,网关 + 多平台,适合批量脚本 | 个人 / 研究 |
| 中文文档 / 阿里云生态 | Qwen Code | 中英双语优化,Qwen2.5-Coder 深度集成 | 国内团队 |
| CI 流水线无头运行 | OpenCode / Codex CLI | Headless 模式 + Docker 沙箱,增速最快生态 | 工程效能 |
企业常见组合是 Claude Code(关键路径)+ Kilo Code(默认路由):前者处理复杂架构决策与大规模重构,后者用 OpenRouter 在 500+ 模型间按任务切换,控制 Token 单价。个人开发者可从 Aider 或 Hermes 起步——前者交互式编码体验最好,后者适合把 Agent 接到 Telegram / Discord 做 7×24 助手。无论选哪条路径,都应把项目记忆文件(CLAUDE.md、AGENTS.md、SKILL.md)纳入版本控制,并与 Cursor Agent Skill 标准对齐,减少多 CLI 并行时的指令漂移。
05Mac 硬件与云端租赁配置矩阵
榜单前列 CLI 与 macOS 有天然绑定:Claude Code 沙箱用 Seatbelt;Goose 的 Rust 二进制在 M 系列上更优;Kilo Code 插件与 macOS 文件权限配合流畅;Aider 依赖 Homebrew / pyenv 工具链。Apple Silicon 统一内存在本地 Ollama 推理时亦优于传统架构——即便主用云端 API,低功耗静音也更适合长时间 Agent 运行。
| CLI 工作负载 | 推荐配置 | 内存 | 说明 |
|---|---|---|---|
| 轻量 CLI(Aider、Hermes 网关) | Mac mini M2/M3 | 16 GB | 主要依赖云端 API,本地算力要求低 |
| 中等强度(Kilo Code、Cline) | MacBook Pro M3 / Mac mini M4 | 16–32 GB | 多文件并发、浏览器自动化需更多内存 |
| 重度(Goose + Docker 沙箱) | Mac mini M4 Pro / MBP M4 Max | 32 GB+ | 并行 Sub-agent + 容器对 I/O 与内存敏感 |
| 本地模型(Ollama + OpenCode) | Mac Studio M4 Ultra | 64 GB+ | 7B/14B 参数本地推理需大统一内存 |
| 7×24 Agent 网关(Hermes / OpenClaw) | NUKCLOUD 独占云端 Mac | 32–96 GB | 长连接、launchd 常驻、租户边界可审计 |
租赁 vs 自购决策:项目制黑客马拉松、MVP 验证、团队快速扩张时,按需租赁比等待采购周期更现实;不同 CLI 对硬件需求差异大,租赁可按项目切换规格。自购适合 24 个月以上的连续重度使用且数据极敏感场景。试错阶段建议先在 定价页 按小时试跑,确认内存档位后再在 下单页 固定月租——比追新芯片更划算的是按Agent 并发数与 Docker 沙箱数量选内存。
06六步 Runbook:OpenRouter CLI + NUKCLOUD 云端 Mac
App 榜回答「本周全球在用哪些 CLI」;你的 Runbook 还要回答「网关与 Runner 放哪」。推荐在 NUKCLOUD 独占 Apple Silicon 上分层:OpenRouter 做广度路由,实例内跑 CLI Agent 与可选本地推理,并与 控制台拨备 Runbook 对齐。
-
01
控制台拨备实例:登录 NUKCLOUD 控制台,选择区域、规格(轻量 CLI 16 GB;Docker 沙箱 + 并行 Agent 建议 32 GB+)与 SSH 密钥;确认租户边界与磁盘配额满足 Hermes 状态库或项目仓库体积。
-
02
SSH 基线与依赖:
ssh user@your-cloud-mac登录后执行xcode-select --install(如需)、brew install git node python@3.12;克隆目标仓库,确认访问 GitHub 与 openrouter.ai 正常。 -
03
配置 OpenRouter 环境变量:在 openrouter.ai 创建 API Key,写入
~/.zshrc:export OPENROUTER_API_KEY="sk-or-...";若用 Claude Code 直连 Anthropic,另设ANTHROPIC_API_KEY。BYOK 模式下费用与直连等价。 -
04
安装目标 CLI:按选型安装——Aider:
pip install aider-chat;Hermes:官方 curl 一键脚本;Claude Code:Anthropic 官方安装器;Kilo Code / Cline:VS Code 插件 + CLI 模式;Goose / OpenCode:按各项目 README 安装。验证--version与 OpenRouter 连通。 -
05
launchd 常驻网关:为 Hermes / Goose 网关编写
~/Library/LaunchAgents/com.yourteam.agent.plist,设置RunAtLoad与KeepAlive;Cursor / Claude Code 的 Base URL 指向内网 OpenRouter 代理。将重复 Prompt 沉淀为 SKILL.md,减少多模型切换时的指令漂移。 -
06
双周复盘与费用评审:每周一访问 OpenRouter Apps 对照 CLI 榜变化;每月对比 OpenRouter 账单「美元支出 Top 3」与 App Token 份额。若 API 月支出持续高于高内存 Mac 租用,评估路由优化;若需 7×24 在线,优先保证网络稳定与内存余量。费用见 定价页。
共享分钟池式 macOS VPS 常见带宽抖动、超卖与长连接重置,对「数千次工具调用、12 小时后台 Agent」尤其致命。Claude Code 的 Seatbelt 沙箱、Hermes 的 SQLite 记忆库、Goose 的 Docker 并行,都需要不被邻居抢占、可审计 uptime 的主机。需要可审计生产平面时,NUKCLOUD 多区域裸金属 Mac / 云端 Mac 节点在独占语义与规格弹性上更易与采购、合规文档对齐——可先按小时试跑,再固定月租规格。