Der komplette 2026-Guide: Kostenlose KI-Tokens für Gemini CLI, Claude Code, Copilot und Cloud-Mac-Deployment

00Master-Tabelle: Free-Tiers im Juni 2026

Alle Werte stammen aus offiziellen Dokumentationen und Plattform-Announcements (Stand 8. Juni 2026). Proxy-Pflicht bezieht sich auf direkten Zugriff aus dem DACH-Raum ohne VPN.

Tool / Plattform	Free-Quota	Paid-Account nötig	Proxy	Top-Hebel
Gemini CLI (OAuth)	1.000 RPD, 60 RPM	Nein	Ja	Keine Kreditkarte, Gemini 2.5 Pro/Flash
Gemini API (AI Studio)	Flash 1.500 RPD; Pro 100 RPD	Nein	Ja	Offizielle Free-Layer-API
Codex CLI	ChatGPT Free (zeitlich begrenzt)	Nein	Ja	GPT-5.3-Codex, OS-Sandbox
Claude Code	In Pro/Max ($20+/Mo)	Ja (oder API-Relay)	Ja	Beste Code-Qualität
OpenCode	Tool gratis, API nach Anbieter	Nein	Nein mit Relay	146K Stars, 75+ Provider
OpenClaw	Tool gratis, Multi-Provider	Nein	Nein mit Relay	Gemini-OAuth-Reuse, Claude setup-token
GitHub Copilot Free	2.000 Completions + 50 Premium/Mo	Nein	Nein	Sofort aktivierbar
Copilot Student	300 Premium/Mo (Pro-Parität)	Nein (Edu)	Nein	Wert ~$10/Mo
Cursor Hobby	2.000 Tab + 50 Slow Premium/Mo	Nein	Nein	Voller VS-Code-Fork
SiliconFlow	20 Mio. Token permanent	Nein	Nein (CN)	DeepSeek, Qwen, GLM-5
Alibaba Model Studio	70 Mio. Token (zeitlich)	Nein	Nein (CN)	70+ Modelle
Zhipu GLM	20 Mio. Token permanent	Nein	Nein (CN)	GLM-5 für Claude-Relay
Groq	14.400 RPD permanent	Nein	Ja	Llama 3.3, Mixtral
NVIDIA NIM	Permanent Free-Layer	Nein	Teils	Llama, Nemotron, DeepSeek

Kombiniert man SiliconFlow (20M), Alibaba (70M) und Zhipu (20M), ergeben sich theoretisch 110 Mio. Tokens ohne Abo — ausreichend für mehrere Monate leichter Codex- oder OpenCode-Last. Gemini CLI bleibt für OAuth-Nutzer der effizienteste West-Pfad: 1.000 Anfragen/Tag entsprechen bei 2.500 Output-Tokens/Call etwa 2,5 Mio. Tokens/Tag im Worst Case, realistisch deutlich weniger durch Flash-Routing.

01Gemini CLI: RPM/RPD-Specs und OAuth-Pfad

Gemini CLI ist der großzügigste offizielle Free-CLI-Pfad — vorausgesetzt, Sie akzeptieren Googles OAuth-Policy und beachten den bevorstehenden Antigravity-Cutover am 18. Juni 2026 für bestimmte Kontogruppen. Enterprise- und API-Key-Pfade bleiben davon getrennt.

Modell	RPM	TPM	RPD
Gemini 2.5 Pro	5	250.000	100
Gemini 2.5 Flash	10	250.000	250
Gemini 2.5 Flash-Lite	15	250.000	1.000
Gemini CLI OAuth gesamt	60	—	1.000

Installation (Node.js 18+): npm install -g @google/gemini-cli oder brew install gemini-cli. Erststart gemini, Option „Sign in with Google“, Browser-OAuth, lokaler Token-Cache. Modellwechsel in der Session: /model oder /model gemini-2.5-flash. Verbrauch: /stats model. Warnung: OAuth-Tokens dürfen laut ToS nicht an Dritt-Proxys geroutet werden — Verstöße riskieren Account-Sperren.

02Codex CLI: ChatGPT-OAuth und Relay-Konfiguration

OpenAIs Codex CLI (Rust, 83K+ Stars) bietet OS-Kernel-Sandbox und Headless-CI. Free-Pfad: ChatGPT-Account per OAuth; Plus/Pro enthalten höhere Kontingente. Für Regionen ohne direkten OpenAI-Zugang: kompatible Endpoints in ~/.codex/config.toml.

Installation: npm install -g @openai/codex oder brew install --cask codex. Relay-Beispiel (SiliconFlow): openai_base_url = "https://api.siliconflow.cn/v1", model = "deepseek-ai/DeepSeek-V3", sandbox_mode = "workspace-write", web_search = "disabled", approval_policy = "on-request". API-Key: export OPENAI_API_KEY="sk-...", Validierung: codex doctor. Interaktiv: codex; Einmal-Tasks: codex "Fix build error in module X".

03Claude Code: Pro-Pfad und kostengünstiges API-Relay

Claude Code hat keinen dauerhaften Free-Tier — entweder Claude Pro/Max ($20+/Monat) oder Anthropic-kompatibles Relay. Installation: curl -fsSL https://claude.ai/install.sh | bash, brew install --cask claude-code oder npm install -g @anthropic-ai/claude-code. Modell: /model in der Session oder claude --model claude-sonnet-4-6.

Relay in ~/.claude/settings.json: ANTHROPIC_BASE_URL und ANTHROPIC_API_KEY auf SiliconFlow oder Zhipu GLM-5 setzen. Kritische Regel: /init niemals auf Monorepos — ein Full-Repo-Scan kann sechsstellige Token verbrennen. Stattdessen einzelne Dateien adressieren; siehe Token-Spar-Matrix unten.

04OpenCode und OpenClaw: BYOK ohne Abo

OpenCode (146K Stars): curl -fsSL https://opencode.ai/install | bash oder brew install anomalyco/tap/opencode. Provider via /connect oder ~/.config/opencode/config.json. Empfohlene Free-Kombinationen:

Provider	Modell	Kosten
Gemini API	Gemini 2.5 Flash	1.500 RPD gratis
SiliconFlow	DeepSeek-V3	20M Registrierungs-Tokens
Ollama lokal	Qwen3 / Llama3	0 €, RAM-abhängig
OpenCode Zen	Grok Code Fast / GLM 4.7	Zeitlich begrenzt gratis

OpenClaw: curl -fsSL https://openclaw.ai/install.sh | bash, dann openclaw onboard --install-daemon. Gemini-OAuth-Reuse: nach gemini-Login openclaw models auth login --provider google-gemini-cli --set-default. Claude-Token: claude setup-token, dann openclaw models auth paste-token --provider anthropic. OpenRouter-Free-Scan: openclaw models scan. Deployment-Details: OpenClaw auf Cloud-Mac.

05GitHub Copilot und Cursor: IDE-Free-Tiers

Plan	Completions	Premium-Requests	Voraussetzung
Copilot Free	2.000/Monat	50/Monat	GitHub-Konto, Enable in Settings
Copilot Student	Unbegrenzt (Pro-Parität)	300/Monat	GitHub Education (.edu)
Cursor Hobby	2.000 Tab/Monat	50 Slow Premium/Monat	Keine Kreditkarte
Cursor Student Pro	Pro-Feature-Set	Pro-Limits	cursor.com/students + Edu

Copilot Student: github.com/settings/education/benefits. Hinweis: Seit 20. April 2026 können Copilot-Pro-Neuregistrierungen pausiert sein — Button-Status prüfen. Open-Source-Maintainer mit qualifizierten Repos: github.com/github-copilot/signup/orgs. Cursor-Verbrauch: app.cursor.sh/account/usage. Agent-Workflows vertiefen: Copilot Coding Agent Runbook.

06API-Anbieter: Endpoints und Registrierungs-Bonus

Anbieter	Endpoint	Registrierungs-Bonus	Modelle
SiliconFlow	`api.siliconflow.cn/v1`	20M Token permanent	DeepSeek-V3, Qwen3.5, GLM-5
Alibaba Model Studio	`dashscope.aliyuncs.com/compatible-mode/v1`	70M Token (zeitlich)	Qwen3.5-Max/Plus, DeepSeek-V3
Zhipu AI	`open.bigmodel.cn/api/paas/v4`	20M Token permanent	GLM-5, GLM-4.7-Flash
InfinigenceAI	cloud.infini-ai.com	Milliarden-Token-Promo	GenStudio API
Groq	`api.groq.com/openai/v1`	14.400 RPD permanent	Llama 3.3, Mixtral, Gemma 2
NVIDIA NIM	build.nvidia.com	Permanent Free-Layer	Llama, Nemotron, DeepSeek

Universelle Konfiguration für Codex, OpenCode und Claude-Relay: export OPENAI_API_KEY="sk-..." plus passende BASE_URL. OpenRouter ergänzt permanente Free-Modelle — Routing-Strategie in LLM-Trends Juni 2026.

07Token-Spar-Matrix: zehn messbare Regeln

#	Regel	Geschätzte Ersparnis	Tools
1	/init auf Monorepos vermeiden	50–90 % pro Session	Claude Code, Codex
2	Einzeldatei statt „gesamtes Projekt"	30–70 %	Alle CLIs
3	Flash-Lite für Triage, Pro nur für Architektur	60–80 %	Gemini CLI
4	Quota-Alarm bei 80 % Free-Layer	Planbarkeit	SiliconFlow, Alibaba
5	Ollama lokal für Lint/Format (`ollama pull qwen3:8b`)	100 % API für Routine	OpenCode, OpenClaw
6	Kurze System-Prompts in Config	5–15 % pro Call	Alle
7	SKILL.md für wiederkehrende Prompts	20–40 % Drift-Reduktion	Cursor, Claude, Hermes
8	OpenRouter Free-Modelle via `openclaw models scan`	Variabel	OpenClaw
9	Multi-Key-Rotation bei 429-Limits	Uptime	Relay-Setups
10	Hersteller-Aktionen tracken (Jahresstart, Anniversary)	10–30 % Bonus-Credits	CN-Plattformen

08Entscheidungsmatrix: Tool × Szenario

Szenario	Empfehlung	Free-Hebel	RAM (Cloud-Mac)
Tägliches Terminal-Coding EU	Gemini CLI + Flash-Lite	1.000 RPD OAuth	16 GB
Maximale Code-Qualität	Claude Code + Relay	SiliconFlow/Zhipu	32 GB
Studierender, IDE-first	Copilot Student + Cursor Edu	0 € Pro-Parität	16 GB
Multi-Model-Routing	OpenCode + OpenRouter	BYOK + Free-Scan	32 GB
7×24 Telegram/Discord Bot	OpenClaw + Hermes	Gemini OAuth Reuse	32–96 GB
CI Headless	Codex CLI + Docker	DeepSeek Relay	32 GB+
Offline / Datenschutz	Ollama + OpenCode	0 API-Kosten	64 GB+

Miete vs. Kauf: Für 3–6 Monate Token-Experimente und parallele CLI-Stacks ist stundenweise Cloud-Mac-Miete oft günstiger als Hardware plus VPN-Infrastruktur. Testen auf der Preisseite, fixieren auf der Bestellseite.

09Sechs-Schritte-Runbook: Free-Tokens + NUKCLOUD Cloud-Mac

Free-Tiers liefern Modelle; ein dedizierter Apple-Silicon-Knoten liefert stabile OAuth-Sessions, launchd-Gateways und auditierbare Mandantengrenzen — abgestimmt mit dem Konsolen-Runbook.

01
Instanz bereitstellen: NUKCLOUD-Konsole — Region wählen, 16 GB für leichte CLI-OAuth, 32 GB+ für OpenClaw/Hermes-Gateway plus Docker. SSH-Key und Disk-Quota für Token-Logs prüfen.
02
SSH-Baseline: ssh user@ihr-cloud-mac, xcode-select --install falls nötig, brew install git node python@3.12. Erreichbarkeit von Google OAuth, GitHub und gewählten API-Endpunkten testen.
03
Free-API-Keys registrieren: SiliconFlow, Groq oder Gemini AI Studio Keys erzeugen. In ~/.zshrc: export GEMINI_API_KEY, OPENAI_API_KEY, OPENROUTER_API_KEY nach Bedarf. Budget-Alarme auf 80 % setzen.
04
CLI-Stack installieren: npm install -g @google/gemini-cli @openai/codex; OpenCode per curl; OpenClaw per openclaw onboard. Gemini OAuth im Browser abschließen; Codex codex doctor; OpenCode /connect.
05
launchd für 7×24: ~/Library/LaunchAgents/com.team.freeagent.plist mit RunAtLoad und KeepAlive für OpenClaw/Hermes. SKILL.md für wiederkehrende Prompts — siehe Hermes-Installguide.
06
Monatliche Quota-Retrospektive: Gemini /stats model, Cursor/Copilot Usage-Dashboards, SiliconFlow-Konsole. Wenn API-Kosten dauerhaft über High-Memory-Mac-Miete liegen, Routing optimieren; sonst Spez fixieren. Kosten: Preisseite, Bestellung: Bestellseite.

Geteilte Minuten-pool-macOS-VPS resetten lange OAuth-Sessions und killen launchd-Gateways — fatal für 7×24 Free-Agent-Stacks. NUKCLOUD dedizierte Cloud-Macs bieten auditierbare Uptime für Gemini-OAuth-Cache und parallele CLI-Prozesse.

10Häufige Fragen

Ist Gemini CLI komplett kostenlos?

Ja, mit normalem Google-Konto per OAuth: 1.000 Anfragen/Tag, 60 RPM, keine Kreditkarte. Beachten Sie den Antigravity-Übergang ab 18. Juni 2026 für bestimmte Privatkonten.

Wie beantrage ich GitHub Copilot Student gratis?

GitHub Education unter github.com/settings/education/benefits mit .edu-Mail oder Studiennachweis. Nach Freigabe Copilot Student mit Pro-Parität (~300 Premium-Requests/Monat).

Reicht Cursor Hobby für produktive Arbeit?

Für leichte Evaluation ja: 2.000 Tab-Completions und 50 Slow-Premium-Requests/Monat. Schwere Refactors oder Agent-Schleifen erfordern Pro ($20/Monat) oder Student Pro via cursor.com/students.

Welche Tools funktionieren ohne VPN aus Deutschland?

Copilot Free, Cursor Hobby, OpenCode plus SiliconFlow/Alibaba/Zhipu-Relay, Ollama lokal. Gemini CLI, Codex OAuth und Groq benötigen in der Regel Proxy-Zugang zu US-Endpunkten.

Warum Cloud-Mac statt Laptop für Free-Agent-Gateways?

OAuth-Tokens und launchd-Prozesse brauchen stabile IP, RAM und 7×24-Uptime. Shared-VPS resetten Sessions; dedizierte NUKCLOUD-Instanzen halten Gemini-OAuth und OpenClaw-Gateways auditierbar online. Einstieg über Konsole.