Der komplette 2026-Guide: Kostenlose KI-Tokens für Gemini CLI, Claude Code, Copilot und Cloud-Mac-Deployment

Stand Juni 2026 lassen sich über 14 Plattformen und 8 CLI-Tools zusammen mehr als 90 Mio. kostenlose Tokens plus 1.000 Gemini-CLI-Anfragen/Tag aktivieren — ohne Kreditkarte. Dieser Leitfaden quantifiziert Quoten, RPM/RPD-Limits und BYOK-Pfade und schließt mit einer Entscheidungsmatrix sowie einem Sechs-Schritte-Runbook auf NUKCLOUD Cloud-Mac.

Wer 2026 nur nach GitHub-Stars sortiert, übersieht die eigentliche Rechnung: Token-Kontingente und OAuth-Quoten entscheiden, ob Gemini CLI, Codex CLI oder OpenCode im Alltag tragfähig sind. Dieser datenbasierte Guide richtet sich an Entwickler, Studierende und Tech Leads: (1) Master-Tabelle aller Free-Tiers; (2) Installations- und Modell-Specs pro Tool; (3) internationale und kompatible API-Anbieter; (4) zehn messbare Token-Spar-Regeln; (5) Hardware-Matrix und NUKCLOUD-Runbook. Ergänzend: Gemini-CLI-Policywechsel, OpenRouter CLI-Ranking, Cursor Agent Skills.

00Master-Tabelle: Free-Tiers im Juni 2026

Alle Werte stammen aus offiziellen Dokumentationen und Plattform-Announcements (Stand 8. Juni 2026). Proxy-Pflicht bezieht sich auf direkten Zugriff aus dem DACH-Raum ohne VPN.

Tool / PlattformFree-QuotaPaid-Account nötigProxyTop-Hebel
Gemini CLI (OAuth)1.000 RPD, 60 RPMNeinJaKeine Kreditkarte, Gemini 2.5 Pro/Flash
Gemini API (AI Studio)Flash 1.500 RPD; Pro 100 RPDNeinJaOffizielle Free-Layer-API
Codex CLIChatGPT Free (zeitlich begrenzt)NeinJaGPT-5.3-Codex, OS-Sandbox
Claude CodeIn Pro/Max ($20+/Mo)Ja (oder API-Relay)JaBeste Code-Qualität
OpenCodeTool gratis, API nach AnbieterNeinNein mit Relay146K Stars, 75+ Provider
OpenClawTool gratis, Multi-ProviderNeinNein mit RelayGemini-OAuth-Reuse, Claude setup-token
GitHub Copilot Free2.000 Completions + 50 Premium/MoNeinNeinSofort aktivierbar
Copilot Student300 Premium/Mo (Pro-Parität)Nein (Edu)NeinWert ~$10/Mo
Cursor Hobby2.000 Tab + 50 Slow Premium/MoNeinNeinVoller VS-Code-Fork
SiliconFlow20 Mio. Token permanentNeinNein (CN)DeepSeek, Qwen, GLM-5
Alibaba Model Studio70 Mio. Token (zeitlich)NeinNein (CN)70+ Modelle
Zhipu GLM20 Mio. Token permanentNeinNein (CN)GLM-5 für Claude-Relay
Groq14.400 RPD permanentNeinJaLlama 3.3, Mixtral
NVIDIA NIMPermanent Free-LayerNeinTeilsLlama, Nemotron, DeepSeek

Kombiniert man SiliconFlow (20M), Alibaba (70M) und Zhipu (20M), ergeben sich theoretisch 110 Mio. Tokens ohne Abo — ausreichend für mehrere Monate leichter Codex- oder OpenCode-Last. Gemini CLI bleibt für OAuth-Nutzer der effizienteste West-Pfad: 1.000 Anfragen/Tag entsprechen bei 2.500 Output-Tokens/Call etwa 2,5 Mio. Tokens/Tag im Worst Case, realistisch deutlich weniger durch Flash-Routing.

01Gemini CLI: RPM/RPD-Specs und OAuth-Pfad

Gemini CLI ist der großzügigste offizielle Free-CLI-Pfad — vorausgesetzt, Sie akzeptieren Googles OAuth-Policy und beachten den bevorstehenden Antigravity-Cutover am 18. Juni 2026 für bestimmte Kontogruppen. Enterprise- und API-Key-Pfade bleiben davon getrennt.

ModellRPMTPMRPD
Gemini 2.5 Pro5250.000100
Gemini 2.5 Flash10250.000250
Gemini 2.5 Flash-Lite15250.0001.000
Gemini CLI OAuth gesamt601.000

Installation (Node.js 18+): npm install -g @google/gemini-cli oder brew install gemini-cli. Erststart gemini, Option „Sign in with Google“, Browser-OAuth, lokaler Token-Cache. Modellwechsel in der Session: /model oder /model gemini-2.5-flash. Verbrauch: /stats model. Warnung: OAuth-Tokens dürfen laut ToS nicht an Dritt-Proxys geroutet werden — Verstöße riskieren Account-Sperren.

02Codex CLI: ChatGPT-OAuth und Relay-Konfiguration

OpenAIs Codex CLI (Rust, 83K+ Stars) bietet OS-Kernel-Sandbox und Headless-CI. Free-Pfad: ChatGPT-Account per OAuth; Plus/Pro enthalten höhere Kontingente. Für Regionen ohne direkten OpenAI-Zugang: kompatible Endpoints in ~/.codex/config.toml.

Installation: npm install -g @openai/codex oder brew install --cask codex. Relay-Beispiel (SiliconFlow): openai_base_url = "https://api.siliconflow.cn/v1", model = "deepseek-ai/DeepSeek-V3", sandbox_mode = "workspace-write", web_search = "disabled", approval_policy = "on-request". API-Key: export OPENAI_API_KEY="sk-...", Validierung: codex doctor. Interaktiv: codex; Einmal-Tasks: codex "Fix build error in module X".

03Claude Code: Pro-Pfad und kostengünstiges API-Relay

Claude Code hat keinen dauerhaften Free-Tier — entweder Claude Pro/Max ($20+/Monat) oder Anthropic-kompatibles Relay. Installation: curl -fsSL https://claude.ai/install.sh | bash, brew install --cask claude-code oder npm install -g @anthropic-ai/claude-code. Modell: /model in der Session oder claude --model claude-sonnet-4-6.

Relay in ~/.claude/settings.json: ANTHROPIC_BASE_URL und ANTHROPIC_API_KEY auf SiliconFlow oder Zhipu GLM-5 setzen. Kritische Regel: /init niemals auf Monorepos — ein Full-Repo-Scan kann sechsstellige Token verbrennen. Stattdessen einzelne Dateien adressieren; siehe Token-Spar-Matrix unten.

04OpenCode und OpenClaw: BYOK ohne Abo

OpenCode (146K Stars): curl -fsSL https://opencode.ai/install | bash oder brew install anomalyco/tap/opencode. Provider via /connect oder ~/.config/opencode/config.json. Empfohlene Free-Kombinationen:

ProviderModellKosten
Gemini APIGemini 2.5 Flash1.500 RPD gratis
SiliconFlowDeepSeek-V320M Registrierungs-Tokens
Ollama lokalQwen3 / Llama30 €, RAM-abhängig
OpenCode ZenGrok Code Fast / GLM 4.7Zeitlich begrenzt gratis

OpenClaw: curl -fsSL https://openclaw.ai/install.sh | bash, dann openclaw onboard --install-daemon. Gemini-OAuth-Reuse: nach gemini-Login openclaw models auth login --provider google-gemini-cli --set-default. Claude-Token: claude setup-token, dann openclaw models auth paste-token --provider anthropic. OpenRouter-Free-Scan: openclaw models scan. Deployment-Details: OpenClaw auf Cloud-Mac.

05GitHub Copilot und Cursor: IDE-Free-Tiers

PlanCompletionsPremium-RequestsVoraussetzung
Copilot Free2.000/Monat50/MonatGitHub-Konto, Enable in Settings
Copilot StudentUnbegrenzt (Pro-Parität)300/MonatGitHub Education (.edu)
Cursor Hobby2.000 Tab/Monat50 Slow Premium/MonatKeine Kreditkarte
Cursor Student ProPro-Feature-SetPro-Limitscursor.com/students + Edu

Copilot Student: github.com/settings/education/benefits. Hinweis: Seit 20. April 2026 können Copilot-Pro-Neuregistrierungen pausiert sein — Button-Status prüfen. Open-Source-Maintainer mit qualifizierten Repos: github.com/github-copilot/signup/orgs. Cursor-Verbrauch: app.cursor.sh/account/usage. Agent-Workflows vertiefen: Copilot Coding Agent Runbook.

06API-Anbieter: Endpoints und Registrierungs-Bonus

AnbieterEndpointRegistrierungs-BonusModelle
SiliconFlowapi.siliconflow.cn/v120M Token permanentDeepSeek-V3, Qwen3.5, GLM-5
Alibaba Model Studiodashscope.aliyuncs.com/compatible-mode/v170M Token (zeitlich)Qwen3.5-Max/Plus, DeepSeek-V3
Zhipu AIopen.bigmodel.cn/api/paas/v420M Token permanentGLM-5, GLM-4.7-Flash
InfinigenceAIcloud.infini-ai.comMilliarden-Token-PromoGenStudio API
Groqapi.groq.com/openai/v114.400 RPD permanentLlama 3.3, Mixtral, Gemma 2
NVIDIA NIMbuild.nvidia.comPermanent Free-LayerLlama, Nemotron, DeepSeek

Universelle Konfiguration für Codex, OpenCode und Claude-Relay: export OPENAI_API_KEY="sk-..." plus passende BASE_URL. OpenRouter ergänzt permanente Free-Modelle — Routing-Strategie in LLM-Trends Juni 2026.

07Token-Spar-Matrix: zehn messbare Regeln

#RegelGeschätzte ErsparnisTools
1/init auf Monorepos vermeiden50–90 % pro SessionClaude Code, Codex
2Einzeldatei statt „gesamtes Projekt"30–70 %Alle CLIs
3Flash-Lite für Triage, Pro nur für Architektur60–80 %Gemini CLI
4Quota-Alarm bei 80 % Free-LayerPlanbarkeitSiliconFlow, Alibaba
5Ollama lokal für Lint/Format (ollama pull qwen3:8b)100 % API für RoutineOpenCode, OpenClaw
6Kurze System-Prompts in Config5–15 % pro CallAlle
7SKILL.md für wiederkehrende Prompts20–40 % Drift-ReduktionCursor, Claude, Hermes
8OpenRouter Free-Modelle via openclaw models scanVariabelOpenClaw
9Multi-Key-Rotation bei 429-LimitsUptimeRelay-Setups
10Hersteller-Aktionen tracken (Jahresstart, Anniversary)10–30 % Bonus-CreditsCN-Plattformen

08Entscheidungsmatrix: Tool × Szenario

SzenarioEmpfehlungFree-HebelRAM (Cloud-Mac)
Tägliches Terminal-Coding EUGemini CLI + Flash-Lite1.000 RPD OAuth16 GB
Maximale Code-QualitätClaude Code + RelaySiliconFlow/Zhipu32 GB
Studierender, IDE-firstCopilot Student + Cursor Edu0 € Pro-Parität16 GB
Multi-Model-RoutingOpenCode + OpenRouterBYOK + Free-Scan32 GB
7×24 Telegram/Discord BotOpenClaw + HermesGemini OAuth Reuse32–96 GB
CI HeadlessCodex CLI + DockerDeepSeek Relay32 GB+
Offline / DatenschutzOllama + OpenCode0 API-Kosten64 GB+

Miete vs. Kauf: Für 3–6 Monate Token-Experimente und parallele CLI-Stacks ist stundenweise Cloud-Mac-Miete oft günstiger als Hardware plus VPN-Infrastruktur. Testen auf der Preisseite, fixieren auf der Bestellseite.

09Sechs-Schritte-Runbook: Free-Tokens + NUKCLOUD Cloud-Mac

Free-Tiers liefern Modelle; ein dedizierter Apple-Silicon-Knoten liefert stabile OAuth-Sessions, launchd-Gateways und auditierbare Mandantengrenzen — abgestimmt mit dem Konsolen-Runbook.

  1. 01
    Instanz bereitstellen: NUKCLOUD-Konsole — Region wählen, 16 GB für leichte CLI-OAuth, 32 GB+ für OpenClaw/Hermes-Gateway plus Docker. SSH-Key und Disk-Quota für Token-Logs prüfen.
  2. 02
    SSH-Baseline: ssh user@ihr-cloud-mac, xcode-select --install falls nötig, brew install git node python@3.12. Erreichbarkeit von Google OAuth, GitHub und gewählten API-Endpunkten testen.
  3. 03
    Free-API-Keys registrieren: SiliconFlow, Groq oder Gemini AI Studio Keys erzeugen. In ~/.zshrc: export GEMINI_API_KEY, OPENAI_API_KEY, OPENROUTER_API_KEY nach Bedarf. Budget-Alarme auf 80 % setzen.
  4. 04
    CLI-Stack installieren: npm install -g @google/gemini-cli @openai/codex; OpenCode per curl; OpenClaw per openclaw onboard. Gemini OAuth im Browser abschließen; Codex codex doctor; OpenCode /connect.
  5. 05
    launchd für 7×24: ~/Library/LaunchAgents/com.team.freeagent.plist mit RunAtLoad und KeepAlive für OpenClaw/Hermes. SKILL.md für wiederkehrende Prompts — siehe Hermes-Installguide.
  6. 06
    Monatliche Quota-Retrospektive: Gemini /stats model, Cursor/Copilot Usage-Dashboards, SiliconFlow-Konsole. Wenn API-Kosten dauerhaft über High-Memory-Mac-Miete liegen, Routing optimieren; sonst Spez fixieren. Kosten: Preisseite, Bestellung: Bestellseite.

Geteilte Minuten-pool-macOS-VPS resetten lange OAuth-Sessions und killen launchd-Gateways — fatal für 7×24 Free-Agent-Stacks. NUKCLOUD dedizierte Cloud-Macs bieten auditierbare Uptime für Gemini-OAuth-Cache und parallele CLI-Prozesse.

10Häufige Fragen

Ist Gemini CLI komplett kostenlos?
Ja, mit normalem Google-Konto per OAuth: 1.000 Anfragen/Tag, 60 RPM, keine Kreditkarte. Beachten Sie den Antigravity-Übergang ab 18. Juni 2026 für bestimmte Privatkonten.
Wie beantrage ich GitHub Copilot Student gratis?
GitHub Education unter github.com/settings/education/benefits mit .edu-Mail oder Studiennachweis. Nach Freigabe Copilot Student mit Pro-Parität (~300 Premium-Requests/Monat).
Reicht Cursor Hobby für produktive Arbeit?
Für leichte Evaluation ja: 2.000 Tab-Completions und 50 Slow-Premium-Requests/Monat. Schwere Refactors oder Agent-Schleifen erfordern Pro ($20/Monat) oder Student Pro via cursor.com/students.
Welche Tools funktionieren ohne VPN aus Deutschland?
Copilot Free, Cursor Hobby, OpenCode plus SiliconFlow/Alibaba/Zhipu-Relay, Ollama lokal. Gemini CLI, Codex OAuth und Groq benötigen in der Regel Proxy-Zugang zu US-Endpunkten.
Warum Cloud-Mac statt Laptop für Free-Agent-Gateways?
OAuth-Tokens und launchd-Prozesse brauchen stabile IP, RAM und 7×24-Uptime. Shared-VPS resetten Sessions; dedizierte NUKCLOUD-Instanzen halten Gemini-OAuth und OpenClaw-Gateways auditierbar online. Einstieg über Konsole.