GitHub Star 수로 AI 코딩 CLI를 고를 때, OpenRouter에서 실제로 조 단위 토큰을 소모하는 도구는 전혀 다른 목록일 수 있습니다. 본 글은 Cursor / Claude Code / Aider / Hermes Agent를 쓰는 개발자와 Tech Lead를 위해 ① OpenRouter App 순위가 Star보다 실사용 강도를 더 잘 반영하는 이유, ② 2026년 6월 2–8일 주간 데이터 기반 전 플랫폼 Top 10과 CLI 전문 순위, ③ Kilo Code, Claude Code, Hermes, Aider, Cline, Goose, OpenCode 등 7대 도구 횡단 비교, ④ 시나리오별 선정 매트릭스와 NUKCLOUD 클라우드 Mac 6단계 구현 목록을 정리합니다. 주간 모델 청구 해설, 6월 LLM 트렌드와 함께 읽으면 좋습니다.
00왜 OpenRouter App 순위가 GitHub Star보다 신뢰할 만한가?
GitHub Star는 「누군가 북마크했다」는 지표이고, OpenRouter App 순위는 「이번 주 실제로 얼마나 많은 토큰을 호출했는가」를 측정합니다. 중립 API 집약 플랫폼인 OpenRouter는 300개 이상 모델, 60개 이상 공급사를 연결하며 월간 트래픽은 약 100조 토큰 규모입니다. 연동 도구가 공개 추적을 선택하면 주간 토큰 소비와 요청 횟수가 모두에게 공개됩니다. 현재로서는 AI CLI 인기를 가장 정량화할 수 있는 온도계에 가깝습니다.
모델 주간 순위가 「전 세계가 어떤 LLM을 쓰는가」를 답한다면, App 순위는 「전 세계가 어떤 껍데기로 그 모델을 호출하는가」를 답합니다. 프로그래밍 작업이 플랫폼 트래픽의 50% 이상을 차지하며, 이번 주에는 CLI와 Agent류가 추가로 주간 토큰의 70% 이상을 흡수했습니다. 2026년 개발자 선정의 중심이 「모델 선택」에서 「Agent 런타임 + 라우팅 전략」으로 이동했음을 보여 줍니다.
OpenRouter의 BYOK(Bring Your Own Key) 모드는 비용을 공급사 직연결 API와 거의 동일하게 맞추므로, 순위 데이터가 「플랫폼 보조금」에 덜 왜곡됩니다. 엔지니어링 팀에게 Star는 신흥 도구 발견에 적합하고, 주간 토큰 점유율은 기본 툴체인 결정에 적합합니다. 둘이 엇갈리면 청구서를 기준으로 삼아야 합니다. 이는 Cursor Agent Skill 글에서 강조한 「반복 Prompt를 SKILL.md로 축적해 다중 도구 전환 시 드리프트를 줄인다」는 접근과 맥을 같이 합니다. 도구 선정과 호스트 선정은 함께 검토해야 합니다.
痛点Star만 보고 Token을 무시하는 네 가지 오해
- Star를 DAU로 착각: Cline은 58,600개 이상 Star를 보유하지만, OpenRouter 이번 주 전 플랫폼 Top 10 상위권에는 Kilo Code와 Claude Code가 올라 있습니다. Star는 커뮤니티 관심을, Token은 유료 의지와 사용 깊이를 반영합니다. 조달 검토는 주간 App 순위에 고정해야 합니다.
- 전 플랫폼 순위와 CLI 전문 순위 차이 무시: Hermes Agent는 전 플랫폼 1위(4.94T)이지만 CLI 전문 순위에서는 3위입니다. 연구, 글쓰기, 자동화 등 다양한 작업을 포괄해 토큰 폭증이 대화형 코딩이 아닌 배치 스크립트에서 나옵니다. 시나리오별로 순위를 읽지 않으면 「1위가 만능」이라는 착각에 빠집니다.
- 오픈소스 = 무비용으로 가정: 대부분 CLI는 BYOK로 무료이지만, Token 청구는 호출량에 비례해 증가합니다. Hermes의 이번 주 4.94T는 자동화 시나리오가 막대한 소비를 만들 수 있음을 보여 줍니다. 소프트웨어 라이선스만 볼 것이 아니라 OpenRouter에서 작업별 토큰 상한과 fallback을 설정해야 합니다.
- CLI 도구와 Mac 호스트 분리: Claude Code 샌드박스는 macOS Seatbelt에 의존합니다. Goose의 Rust 바이너리는 Apple Silicon에서 성능이 더 좋습니다. 게이트웨이가 초과판매 Linux VPS에서 돌면 CLI 교체보다 장연결 리셋이 Agent 프로젝트를 더 자주 죽입니다. 7×24 CLI 워크플로에는 감사 가능한 macOS 연산이 필요하며, 「가장 싼 클라우드 호스트」와는 다른 길입니다.
01데이터 출처와 전 플랫폼 Top 10 스냅샷
본문 데이터는 openrouter.ai/apps 공개 App 순위에서 가져왔으며, 통계 차원은 This Week(자연 주간 롤링)이고 기준 시점은 2026년 6월 2일–6월 8일입니다. 공개 추적을 선택한 앱만 집계되므로 전수 표본은 아니지만, 주류 CLI와 Agent 도구는 포괄합니다. CLI 전문 순위는 여기서 순수 엔터테인먼트·비개발 앱을 제외하고, 터미널 사용성, 모델 호환성, 개발자 경험, 커뮤니티 활성도를 종합합니다.
| 전 플랫폼 순위 | 도구 | 유형 | 이번 주 토큰량 | 비고 |
|---|---|---|---|---|
| 1 | Hermes Agent | AI Agent(CLI/개인) | 4.94T | 전 플랫폼 1위, 오픈소스 무장벽 |
| 2 | OpenClaw | AI Agent(범용) | 1.26T | Kilo Code와 주간량 유사 |
| 3 | Kilo Code | CLI / IDE 플러그인 | 1.22T | CLI 전문 1위 |
| 4 | Claude Code | CLI(터미널 네이티브) | 606B | 폐쇄형 추론 상한 |
| 5 | Descript | AI 영상/팟캐스트 | 454B | 비개발 |
| 6 | pi | 프로그래밍 AI | 384B | — |
| 7 | Lemonade | Roblox AI | 317B | 비개발 |
| 8 | Pioneer (production) | 추론 API | 268B | — |
| 9 | GitLawb | 블록체인 협업 | 253B | 비개발 |
| 10 | Janitor AI | AI 채팅 플랫폼 | 218B | 비개발 |
이번 주 핵심 트렌드는 CLI와 Agent류가 주간 토큰의 약 70% 이상을 소모한다는 점입니다. Kilo Code와 Claude Code가 모두 전 플랫폼 Top 5에 들어가 코드 CLI의 양대 축을 이룹니다. Hermes는 2위 OpenClaw 대비 약 4배 토큰으로 앞서며, 자동화·개인 Agent 시나리오의 높은 침투율을 보여 줍니다. Descript, Lemonade, Janitor AI 같은 비개발 도구도 순위에 남아 OpenRouter 사용자층이 순수 개발자를 넘어섰음을 시사합니다.
- 인용 가능 데이터 1: Hermes Agent 이번 주 4.94T 토큰은 2위 OpenClaw(1.26T)의 약 3.9배입니다.
- 인용 가능 데이터 2: Kilo Code 1.22T와 OpenClaw 1.26T는 40B 차이에 불과해, CLI와 범용 Agent 사용 깊이가 같은 수준입니다.
- 인용 가능 데이터 3: CLI + Agent 도구가 이번 주 플랫폼 토큰의 70% 이상을 차지하며, 프로그래밍 작업이 전체 트래픽의 50% 이상입니다(트렌드 해설 참고).
02CLI 도구 전문 순위 Top 10
아래는 비개발 앱을 제외한 CLI 전문 순위로, 이번 주 실시간 데이터, 최근 30일 누적, 기능 완성도를 종합했습니다. 전 플랫폼 순위와 완전히 일치하지 않습니다. Hermes는 전 플랫폼 1위이지만 「순수 CLI 코딩 워크플로」 맥락에서는 Kilo Code와 Claude Code의 개발자 침투가 더 집중됩니다.
| CLI 순위 | 도구 | 전 플랫폼 이번 주 | 이번 주 토큰 | 오픈소스 | 핵심 강점 |
|---|---|---|---|---|---|
| 1 | Kilo Code | #3 | 1.22T | O | 500+ 모델, Architect/Code/Debug/Orchestrator 4모드 |
| 2 | Claude Code | #4 | 606B | X | 터미널 네이티브, Sub-agent 오케스트레이션, Seatbelt 샌드박스 |
| 3 | Hermes Agent | #1 | 4.94T | O | 완전 오픈소스, 다중 플랫폼 게이트웨이, 자동화 배치 |
| 4 | Aider | 순위 외 | ~2.4B/월 | O | Git 네이티브 최강, Tree-sitter Repo Map, 41,200+ Star |
| 5 | Cline | 순위 외 | ~140B/월 | O | 단계별 승인 철학, 브라우저 자동화, 58,600+ Star |
| 6 | Goose | 순위 외 | ~46.4B/월 | O | MCP 네이티브 1,700+ 서비스, Recipes 워크플로, Rust 빌드 |
| 7 | OpenCode | 순위 외 | 급성장 | O | 75+ 공급사, 97,500+ Star, 가장 빠른 성장 |
| 8 | OpenAI Codex CLI | 순위 외 | ~91B/월 | O | 클라우드 샌드박스, ~1000 Token/초, Headless CI |
| 9 | Roo Code | 순위 외 | ~111.8B/월 | O | Cline 강화 Fork, Boomerang 서브태스크, 작업 보드 |
| 10 | Qwen Code | 순위 외 | ~39.9M/월 | O | 알리바바 제작, 중영 이중어 최적화, Qwen2.5-Coder 심층 연동 |
Kilo Code의 이번 주 1.22T는 VS Code / JetBrains 플러그인 생태, 무프리미엄 BYOK, 네 가지 작업 모드와 직결됩니다. Architect는 시스템 설계, Code는 파일 수정, Debug는 근본 원인 추적, Orchestrator는 서브태스크 병렬 조율을 담당합니다. Claude Code는 606B로 전문 2위를 유지합니다. 터미널 네이티브, Plan Mode의 선계획 후실행, CLAUDE.md 프로젝트 메모리, macOS Seatbelt 시스템 샌드박스가 결합되어 기업 대규모 리팩터링에 적합합니다. Hermes Agent는 토큰량이 압도적이지만 전문 3위인데, 사용자층에 비대화형 자동화 배포가 많아 「터미널에 앉아 코드를 쓰는」 프로필과 다릅니다.
순위 밖 도구도 검토 가치가 있습니다. Aider는 Git 워크플로가 가장 성숙한 순수 CLI(자동 Commit, Architect 듀얼 모델로 비용 절감)입니다. Cline은 단계별 감사가 필요한 컴플라이언스 팀에 맞습니다. Goose는 DevOps 전 구간(Issue → PR)을 겨냥합니다. OpenCode는 Star 성장이 가장 빠르며 Docker 샌드박스와 AGENTS.md 메모리가 CI에 유리합니다. OpenRouter 순위 밖이라 쓸모없다는 뜻은 아닙니다. 많은 팀이 직연결 API나 비공개 추적을 쓰지만, 주간 상위권은 「기본 툴체인」 방향을 가이드하기에 충분합니다.
037대 CLI 기능 비교 매트릭스
| 기능 | Kilo Code | Claude Code | Hermes Agent | Aider | Cline | Goose | OpenCode |
|---|---|---|---|---|---|---|---|
| 오픈소스 | O | X | O | O | O | O | O |
| MCP 지원 | O | O | O | X | O | O | O |
| 샌드박스 격리 | X | O Seatbelt | X | X | 스냅샷 롤백 | Docker | Docker |
| Sub-agent | O | O | O | X | O | O | O |
| Plan Mode | O | O | O | X | O | O | O |
| 프로젝트 메모리 | O | CLAUDE.md | O | X | .clinerules | .goosehints | AGENTS.md |
| Headless CI | O | O | O | O | O | O | O |
| 모델 수 | 500+ | Claude Only | 다중 모델 | 100+ | 전 플랫폼 | 다중 모델 | 75+ |
| 무료 BYOK | O | X | O | O | O | O | O |
| Git 연동 | O | O | O | OO | O | O | O |
| 브라우저 자동화 | X | X | X | X | O | X | X |
| 음성 입력 | X | X | X | O | X | X | X |
| 데스크톱 GUI | X | X | X | X | X | O | X |
매트릭스에서 세 가지 선정 법칙이 드러납니다. ① 모델 유연성과 추론 상한은 종종 상충합니다. Kilo Code / OpenCode는 다중 모델 라우팅에, Claude Code는 크리티컬 경로 복잡 추론에 적합합니다. ② MCP는 2026년 Agent 표준에 가깝고 Aider만 빠져 있어, 기업 툴체인 확장 시 추가 평가가 필요합니다. ③ 보안 모델은 계층이 뚜렷합니다. Claude Code 시스템 샌드박스 > Cline 단계별 승인 > Goose/OpenCode Docker 컨테이너 > 샌드박스 없는 오픈소스 CLI 순입니다. Mac 사용자는 Claude Code Seatbelt와 Goose의 Apple Silicon Rust 성능 이점을 우선 활용하는 것이 좋습니다.
04시나리오별 선정 가이드
| 시나리오 | 추천 도구 | 이유 | 팀 규모 |
|---|---|---|---|
| 일상 코딩 + Git 히스토리 정돈 | Aider | 자동 Commit, 즉시 롤백, Architect 듀얼 모델로 비용 절감 | 개인 / 소규모 |
| 대규모 리팩터링 + 예산 여유 | Claude Code | 최강 추론, Sub-agent 병렬, 이번 주 606B로 검증된 인지도 | 중형 / 기업 |
| 최대 모델 유연성 | Kilo Code | 500+ 모델, 4모드, 이번 주 1.22T로 전 플랫폼 Top 3 | 소팀 2–10인 |
| 보안 민감 / 단계별 감사 | Cline | 매 단계 확인 + 워크스페이스 스냅샷, 브라우저 자동화 | 컴플라이언스 팀 |
| DevOps / 툴체인 자동화 | Goose | MCP 네이티브 1,700+ 서비스, Recipes로 워크플로 고정 | Platform 팀 |
| 예산 제한 / 7×24 자동화 | Hermes Agent | 완전 무료 오픈소스, 게이트웨이 + 다중 플랫폼, 배치 스크립트에 적합 | 개인 / 연구 |
| 중국어 문서 / 알리 클라우드 생태 | Qwen Code | 중영 이중어 최적화, Qwen2.5-Coder 심층 연동 | 중국 내 팀 |
| CI 파이프라인 헤드리스 | OpenCode / Codex CLI | Headless + Docker 샌드박스, 가장 빠른 성장 생태 | 엔지니어링 생산성 |
기업에서 흔한 조합은 Claude Code(크리티컬 경로) + Kilo Code(기본 라우팅)입니다. 전자는 복잡한 아키텍처 결정과 대규모 리팩터링을, 후자는 OpenRouter로 500개 이상 모델을 작업별 전환하며 토큰 단가를 제어합니다. 개인 개발자는 Aider 또는 Hermes로 시작할 수 있습니다. 전자는 대화형 코딩 경험이 가장 좋고, 후자는 Agent를 Telegram / Discord에 붙여 7×24 어시스턴트로 쓰기에 적합합니다. 어떤 경로를 택하든 프로젝트 메모리 파일(CLAUDE.md, AGENTS.md, SKILL.md)을 버전 관리에 넣고 Cursor Agent Skill 표준과 맞추면, 다중 CLI 병행 시 지시 드리프트를 줄일 수 있습니다.
05Mac 하드웨어와 클라우드 임대 구성 매트릭스
순위 상위 CLI는 macOS와 자연스럽게 맞물립니다. Claude Code 샌드박스는 Seatbelt를, Goose Rust 바이너리는 M 시리즈에서 더 빠르며, Kilo Code 플러그인은 macOS 파일 권한과 잘 맞고, Aider는 Homebrew / pyenv 툴체인에 의존합니다. Apple Silicon 통합 메모리는 로컬 Ollama 추론에서도 전통 아키텍처보다 유리합니다. 주로 클라우드 API를 써도 저전력·저소음이 장시간 Agent 실행에 유리합니다.
| CLI 워크로드 | 권장 구성 | 메모리 | 설명 |
|---|---|---|---|
| 경량 CLI(Aider, Hermes 게이트웨이) | Mac mini M2/M3 | 16 GB | 주로 클라우드 API, 로컬 연산 요구 낮음 |
| 중간 강도(Kilo Code, Cline) | MacBook Pro M3 / Mac mini M4 | 16–32 GB | 다중 파일 동시 처리, 브라우저 자동화에 메모리 추가 |
| 고강도(Goose + Docker 샌드박스) | Mac mini M4 Pro / MBP M4 Max | 32 GB+ | 병렬 Sub-agent + 컨테이너가 I/O·메모리에 민감 |
| 로컬 모델(Ollama + OpenCode) | Mac Studio M4 Ultra | 64 GB+ | 7B/14B 로컬 추론에 큰 통합 메모리 필요 |
| 7×24 Agent 게이트웨이(Hermes / OpenClaw) | NUKCLOUD 전용 클라우드 Mac | 32–96 GB | 장연결, launchd 상주, 감사 가능한 테넌트 경계 |
임대 vs 자가 구매 결정: 프로젝트형 해커톤, MVP 검증, 팀 급확장 시 온디맨드 임대가 조달 주기를 기다리는 것보다 현실적입니다. CLI마다 하드웨어 요구가 달라 임대는 프로젝트별 스펙 전환이 쉽습니다. 자가 구매는 24개월 이상 연속 고강도 사용이고 데이터가 극도로 민감할 때 맞습니다. 시행착오 단계에서는 가격 페이지에서 시간 단위로 먼저 돌려 보고, 메모리 티어를 확인한 뒤 주문 페이지에서 월 임대를 고정하는 것이 좋습니다. 최신 칩을 쫓기보다 Agent 동시 수와 Docker 샌드박스 개수에 맞춰 메모리를 고르는 편이 경제적입니다.
066단계 Runbook: OpenRouter CLI + NUKCLOUD 클라우드 Mac
App 순위는 「이번 주 전 세계가 어떤 CLI를 쓰는가」를 답합니다. Runbook은 추가로 「게이트웨이와 Runner를 어디에 둘 것인가」를 답해야 합니다. NUKCLOUD 전용 Apple Silicon에서는 OpenRouter로 폭을 확보하고 인스턴스 내 CLI Agent와 선택적 로컬 추론을 배치하며, 콘솔 프로비저닝 Runbook과 맞추는 구성을 권장합니다.
-
01
콘솔에서 인스턴스 프로비저닝: NUKCLOUD 콘솔에 로그인해 리전, 스펙(경량 CLI 16 GB; Docker 샌드박스 + 병렬 Agent는 32 GB+ 권장), SSH 키를 선택합니다. 테넌트 경계와 디스크 할당량이 Hermes 상태 DB나 프로젝트 저장소 크기를 수용하는지 확인합니다.
-
02
SSH 베이스라인과 의존성:
ssh user@your-cloud-mac으로 접속한 뒤xcode-select --install(필요 시),brew install git node python@3.12를 실행합니다. 대상 저장소를 클론하고 GitHub와 openrouter.ai 접속이 정상인지 확인합니다. -
03
OpenRouter 환경 변수 설정: openrouter.ai에서 API Key를 만들고
~/.zshrc에export OPENROUTER_API_KEY="sk-or-..."를 기록합니다. Claude Code를 Anthropic에 직연결한다면ANTHROPIC_API_KEY도 설정합니다. BYOK 모드에서는 비용이 직연결과 거의 같습니다. -
04
대상 CLI 설치: 선정에 따라 설치합니다. Aider:
pip install aider-chat; Hermes: 공식 curl 원클릭 스크립트; Claude Code: Anthropic 공식 설치기; Kilo Code / Cline: VS Code 플러그인 + CLI 모드; Goose / OpenCode: 각 README 절차.--version과 OpenRouter 연결을 검증합니다. -
05
launchd 상주 게이트웨이: Hermes / Goose 게이트웨이용
~/Library/LaunchAgents/com.yourteam.agent.plist를 작성하고RunAtLoad,KeepAlive를 설정합니다. Cursor / Claude Code Base URL을 사내 OpenRouter 프록시로 향하게 합니다. 반복 Prompt는 SKILL.md로 모아 다중 모델 전환 시 지시 드리프트를 줄입니다. -
06
격주 리뷰와 비용 검토: 매주 월요일 OpenRouter Apps에서 CLI 순위 변화를 대조합니다. 매월 OpenRouter 청구 「달러 지출 Top 3」와 App 토큰 점유를 비교합니다. API 월 지출이 고메모리 Mac 임대를 지속 초과하면 라우팅 최적화를 검토하고, 7×24 온라인이 필요하면 네트워크 안정과 메모리 여유를 우선합니다. 비용은 가격 페이지를 참고하세요.
공유 분 단위 macOS VPS에서는 대역폭 지터, 초과판매, 장연결 리셋이 흔해 「수천 번 도구 호출, 12시간 백그라운드 Agent」에 특히 치명적입니다. Claude Code Seatbelt 샌드박스, Hermes SQLite 메모리 DB, Goose Docker 병렬은 이웃에 밀리지 않고 감사 가능한 uptime을 요구합니다. 감사 가능한 프로덕션 플레인이 필요하면 NUKCLOUD 다리전 bare-metal Mac / 클라우드 Mac 노드의 전용 의미가 조달·컴플라이언스 문서와 맞기 쉽습니다. 시간 단위로 먼저 시험한 뒤 월 임대 스펙을 고정할 수 있습니다.