Wer 2026 nur nach GitHub-Stars sortiert, übersieht die eigentliche Rechnung: Token-Kontingente und OAuth-Quoten entscheiden, ob Gemini CLI, Codex CLI oder OpenCode im Alltag tragfähig sind. Dieser datenbasierte Guide richtet sich an Entwickler, Studierende und Tech Leads: (1) Master-Tabelle aller Free-Tiers; (2) Installations- und Modell-Specs pro Tool; (3) internationale und kompatible API-Anbieter; (4) zehn messbare Token-Spar-Regeln; (5) Hardware-Matrix und NUKCLOUD-Runbook. Ergänzend: Gemini-CLI-Policywechsel, OpenRouter CLI-Ranking, Cursor Agent Skills.
00Master-Tabelle: Free-Tiers im Juni 2026
Alle Werte stammen aus offiziellen Dokumentationen und Plattform-Announcements (Stand 8. Juni 2026). Proxy-Pflicht bezieht sich auf direkten Zugriff aus dem DACH-Raum ohne VPN.
| Tool / Plattform | Free-Quota | Paid-Account nötig | Proxy | Top-Hebel |
|---|---|---|---|---|
| Gemini CLI (OAuth) | 1.000 RPD, 60 RPM | Nein | Ja | Keine Kreditkarte, Gemini 2.5 Pro/Flash |
| Gemini API (AI Studio) | Flash 1.500 RPD; Pro 100 RPD | Nein | Ja | Offizielle Free-Layer-API |
| Codex CLI | ChatGPT Free (zeitlich begrenzt) | Nein | Ja | GPT-5.3-Codex, OS-Sandbox |
| Claude Code | In Pro/Max ($20+/Mo) | Ja (oder API-Relay) | Ja | Beste Code-Qualität |
| OpenCode | Tool gratis, API nach Anbieter | Nein | Nein mit Relay | 146K Stars, 75+ Provider |
| OpenClaw | Tool gratis, Multi-Provider | Nein | Nein mit Relay | Gemini-OAuth-Reuse, Claude setup-token |
| GitHub Copilot Free | 2.000 Completions + 50 Premium/Mo | Nein | Nein | Sofort aktivierbar |
| Copilot Student | 300 Premium/Mo (Pro-Parität) | Nein (Edu) | Nein | Wert ~$10/Mo |
| Cursor Hobby | 2.000 Tab + 50 Slow Premium/Mo | Nein | Nein | Voller VS-Code-Fork |
| SiliconFlow | 20 Mio. Token permanent | Nein | Nein (CN) | DeepSeek, Qwen, GLM-5 |
| Alibaba Model Studio | 70 Mio. Token (zeitlich) | Nein | Nein (CN) | 70+ Modelle |
| Zhipu GLM | 20 Mio. Token permanent | Nein | Nein (CN) | GLM-5 für Claude-Relay |
| Groq | 14.400 RPD permanent | Nein | Ja | Llama 3.3, Mixtral |
| NVIDIA NIM | Permanent Free-Layer | Nein | Teils | Llama, Nemotron, DeepSeek |
Kombiniert man SiliconFlow (20M), Alibaba (70M) und Zhipu (20M), ergeben sich theoretisch 110 Mio. Tokens ohne Abo — ausreichend für mehrere Monate leichter Codex- oder OpenCode-Last. Gemini CLI bleibt für OAuth-Nutzer der effizienteste West-Pfad: 1.000 Anfragen/Tag entsprechen bei 2.500 Output-Tokens/Call etwa 2,5 Mio. Tokens/Tag im Worst Case, realistisch deutlich weniger durch Flash-Routing.
01Gemini CLI: RPM/RPD-Specs und OAuth-Pfad
Gemini CLI ist der großzügigste offizielle Free-CLI-Pfad — vorausgesetzt, Sie akzeptieren Googles OAuth-Policy und beachten den bevorstehenden Antigravity-Cutover am 18. Juni 2026 für bestimmte Kontogruppen. Enterprise- und API-Key-Pfade bleiben davon getrennt.
| Modell | RPM | TPM | RPD |
|---|---|---|---|
| Gemini 2.5 Pro | 5 | 250.000 | 100 |
| Gemini 2.5 Flash | 10 | 250.000 | 250 |
| Gemini 2.5 Flash-Lite | 15 | 250.000 | 1.000 |
| Gemini CLI OAuth gesamt | 60 | — | 1.000 |
Installation (Node.js 18+): npm install -g @google/gemini-cli oder brew install gemini-cli. Erststart gemini, Option „Sign in with Google“, Browser-OAuth, lokaler Token-Cache. Modellwechsel in der Session: /model oder /model gemini-2.5-flash. Verbrauch: /stats model. Warnung: OAuth-Tokens dürfen laut ToS nicht an Dritt-Proxys geroutet werden — Verstöße riskieren Account-Sperren.
02Codex CLI: ChatGPT-OAuth und Relay-Konfiguration
OpenAIs Codex CLI (Rust, 83K+ Stars) bietet OS-Kernel-Sandbox und Headless-CI. Free-Pfad: ChatGPT-Account per OAuth; Plus/Pro enthalten höhere Kontingente. Für Regionen ohne direkten OpenAI-Zugang: kompatible Endpoints in ~/.codex/config.toml.
Installation: npm install -g @openai/codex oder brew install --cask codex. Relay-Beispiel (SiliconFlow): openai_base_url = "https://api.siliconflow.cn/v1", model = "deepseek-ai/DeepSeek-V3", sandbox_mode = "workspace-write", web_search = "disabled", approval_policy = "on-request". API-Key: export OPENAI_API_KEY="sk-...", Validierung: codex doctor. Interaktiv: codex; Einmal-Tasks: codex "Fix build error in module X".
03Claude Code: Pro-Pfad und kostengünstiges API-Relay
Claude Code hat keinen dauerhaften Free-Tier — entweder Claude Pro/Max ($20+/Monat) oder Anthropic-kompatibles Relay. Installation: curl -fsSL https://claude.ai/install.sh | bash, brew install --cask claude-code oder npm install -g @anthropic-ai/claude-code. Modell: /model in der Session oder claude --model claude-sonnet-4-6.
Relay in ~/.claude/settings.json: ANTHROPIC_BASE_URL und ANTHROPIC_API_KEY auf SiliconFlow oder Zhipu GLM-5 setzen. Kritische Regel: /init niemals auf Monorepos — ein Full-Repo-Scan kann sechsstellige Token verbrennen. Stattdessen einzelne Dateien adressieren; siehe Token-Spar-Matrix unten.
04OpenCode und OpenClaw: BYOK ohne Abo
OpenCode (146K Stars): curl -fsSL https://opencode.ai/install | bash oder brew install anomalyco/tap/opencode. Provider via /connect oder ~/.config/opencode/config.json. Empfohlene Free-Kombinationen:
| Provider | Modell | Kosten |
|---|---|---|
| Gemini API | Gemini 2.5 Flash | 1.500 RPD gratis |
| SiliconFlow | DeepSeek-V3 | 20M Registrierungs-Tokens |
| Ollama lokal | Qwen3 / Llama3 | 0 €, RAM-abhängig |
| OpenCode Zen | Grok Code Fast / GLM 4.7 | Zeitlich begrenzt gratis |
OpenClaw: curl -fsSL https://openclaw.ai/install.sh | bash, dann openclaw onboard --install-daemon. Gemini-OAuth-Reuse: nach gemini-Login openclaw models auth login --provider google-gemini-cli --set-default. Claude-Token: claude setup-token, dann openclaw models auth paste-token --provider anthropic. OpenRouter-Free-Scan: openclaw models scan. Deployment-Details: OpenClaw auf Cloud-Mac.
05GitHub Copilot und Cursor: IDE-Free-Tiers
| Plan | Completions | Premium-Requests | Voraussetzung |
|---|---|---|---|
| Copilot Free | 2.000/Monat | 50/Monat | GitHub-Konto, Enable in Settings |
| Copilot Student | Unbegrenzt (Pro-Parität) | 300/Monat | GitHub Education (.edu) |
| Cursor Hobby | 2.000 Tab/Monat | 50 Slow Premium/Monat | Keine Kreditkarte |
| Cursor Student Pro | Pro-Feature-Set | Pro-Limits | cursor.com/students + Edu |
Copilot Student: github.com/settings/education/benefits. Hinweis: Seit 20. April 2026 können Copilot-Pro-Neuregistrierungen pausiert sein — Button-Status prüfen. Open-Source-Maintainer mit qualifizierten Repos: github.com/github-copilot/signup/orgs. Cursor-Verbrauch: app.cursor.sh/account/usage. Agent-Workflows vertiefen: Copilot Coding Agent Runbook.
06API-Anbieter: Endpoints und Registrierungs-Bonus
| Anbieter | Endpoint | Registrierungs-Bonus | Modelle |
|---|---|---|---|
| SiliconFlow | api.siliconflow.cn/v1 | 20M Token permanent | DeepSeek-V3, Qwen3.5, GLM-5 |
| Alibaba Model Studio | dashscope.aliyuncs.com/compatible-mode/v1 | 70M Token (zeitlich) | Qwen3.5-Max/Plus, DeepSeek-V3 |
| Zhipu AI | open.bigmodel.cn/api/paas/v4 | 20M Token permanent | GLM-5, GLM-4.7-Flash |
| InfinigenceAI | cloud.infini-ai.com | Milliarden-Token-Promo | GenStudio API |
| Groq | api.groq.com/openai/v1 | 14.400 RPD permanent | Llama 3.3, Mixtral, Gemma 2 |
| NVIDIA NIM | build.nvidia.com | Permanent Free-Layer | Llama, Nemotron, DeepSeek |
Universelle Konfiguration für Codex, OpenCode und Claude-Relay: export OPENAI_API_KEY="sk-..." plus passende BASE_URL. OpenRouter ergänzt permanente Free-Modelle — Routing-Strategie in LLM-Trends Juni 2026.
07Token-Spar-Matrix: zehn messbare Regeln
| # | Regel | Geschätzte Ersparnis | Tools |
|---|---|---|---|
| 1 | /init auf Monorepos vermeiden | 50–90 % pro Session | Claude Code, Codex |
| 2 | Einzeldatei statt „gesamtes Projekt" | 30–70 % | Alle CLIs |
| 3 | Flash-Lite für Triage, Pro nur für Architektur | 60–80 % | Gemini CLI |
| 4 | Quota-Alarm bei 80 % Free-Layer | Planbarkeit | SiliconFlow, Alibaba |
| 5 | Ollama lokal für Lint/Format (ollama pull qwen3:8b) | 100 % API für Routine | OpenCode, OpenClaw |
| 6 | Kurze System-Prompts in Config | 5–15 % pro Call | Alle |
| 7 | SKILL.md für wiederkehrende Prompts | 20–40 % Drift-Reduktion | Cursor, Claude, Hermes |
| 8 | OpenRouter Free-Modelle via openclaw models scan | Variabel | OpenClaw |
| 9 | Multi-Key-Rotation bei 429-Limits | Uptime | Relay-Setups |
| 10 | Hersteller-Aktionen tracken (Jahresstart, Anniversary) | 10–30 % Bonus-Credits | CN-Plattformen |
08Entscheidungsmatrix: Tool × Szenario
| Szenario | Empfehlung | Free-Hebel | RAM (Cloud-Mac) |
|---|---|---|---|
| Tägliches Terminal-Coding EU | Gemini CLI + Flash-Lite | 1.000 RPD OAuth | 16 GB |
| Maximale Code-Qualität | Claude Code + Relay | SiliconFlow/Zhipu | 32 GB |
| Studierender, IDE-first | Copilot Student + Cursor Edu | 0 € Pro-Parität | 16 GB |
| Multi-Model-Routing | OpenCode + OpenRouter | BYOK + Free-Scan | 32 GB |
| 7×24 Telegram/Discord Bot | OpenClaw + Hermes | Gemini OAuth Reuse | 32–96 GB |
| CI Headless | Codex CLI + Docker | DeepSeek Relay | 32 GB+ |
| Offline / Datenschutz | Ollama + OpenCode | 0 API-Kosten | 64 GB+ |
Miete vs. Kauf: Für 3–6 Monate Token-Experimente und parallele CLI-Stacks ist stundenweise Cloud-Mac-Miete oft günstiger als Hardware plus VPN-Infrastruktur. Testen auf der Preisseite, fixieren auf der Bestellseite.
09Sechs-Schritte-Runbook: Free-Tokens + NUKCLOUD Cloud-Mac
Free-Tiers liefern Modelle; ein dedizierter Apple-Silicon-Knoten liefert stabile OAuth-Sessions, launchd-Gateways und auditierbare Mandantengrenzen — abgestimmt mit dem Konsolen-Runbook.
-
01
Instanz bereitstellen: NUKCLOUD-Konsole — Region wählen, 16 GB für leichte CLI-OAuth, 32 GB+ für OpenClaw/Hermes-Gateway plus Docker. SSH-Key und Disk-Quota für Token-Logs prüfen.
-
02
SSH-Baseline:
ssh user@ihr-cloud-mac,xcode-select --installfalls nötig,brew install git node python@3.12. Erreichbarkeit von Google OAuth, GitHub und gewählten API-Endpunkten testen. -
03
Free-API-Keys registrieren: SiliconFlow, Groq oder Gemini AI Studio Keys erzeugen. In
~/.zshrc:export GEMINI_API_KEY,OPENAI_API_KEY,OPENROUTER_API_KEYnach Bedarf. Budget-Alarme auf 80 % setzen. -
04
CLI-Stack installieren:
npm install -g @google/gemini-cli @openai/codex; OpenCode per curl; OpenClaw peropenclaw onboard. Gemini OAuth im Browser abschließen; Codexcodex doctor; OpenCode/connect. -
05
launchd für 7×24:
~/Library/LaunchAgents/com.team.freeagent.plistmitRunAtLoadundKeepAlivefür OpenClaw/Hermes. SKILL.md für wiederkehrende Prompts — siehe Hermes-Installguide. -
06
Monatliche Quota-Retrospektive: Gemini
/stats model, Cursor/Copilot Usage-Dashboards, SiliconFlow-Konsole. Wenn API-Kosten dauerhaft über High-Memory-Mac-Miete liegen, Routing optimieren; sonst Spez fixieren. Kosten: Preisseite, Bestellung: Bestellseite.
Geteilte Minuten-pool-macOS-VPS resetten lange OAuth-Sessions und killen launchd-Gateways — fatal für 7×24 Free-Agent-Stacks. NUKCLOUD dedizierte Cloud-Macs bieten auditierbare Uptime für Gemini-OAuth-Cache und parallele CLI-Prozesse.