Guide complet 2026 : Obtenir des tokens IA gratuits – Gemini CLI, Claude Code, Copilot et déploiement Mac cloud

La question n'est plus « existe-t-il des outils IA gratuits ? » mais « comment les orchestrer sans gaspiller quota ni compromettre la production ». Ce guide s'adresse aux développeurs, étudiants et responsables techniques qui comparent Gemini CLI, Codex CLI, Claude Code, OpenCode, OpenClaw, GitHub Copilot et Cursor. Nous passons en revue les quotas officiels (juin 2026), les chemins d'installation, les APIs gratuites compatibles, dix pratiques d'économie de tokens et un déploiement en six étapes sur Mac cloud NUKCLOUD. Pour le contexte réglementaire Gemini, voir la transition Antigravity ; pour le routage avancé, le classement OpenRouter CLI et les Agent Skills Cursor.

00Panorama des quotas gratuits en juin 2026

L'année 2026 consacre la séparation entre logiciel gratuit et inférence gratuite. La plupart des CLI (OpenCode, OpenClaw, Aider) n'imposent aucun abonnement : vous payez — ou non — l'API en aval. Les exceptions notablement généreuses restent Gemini CLI via OAuth (1 000 requêtes/jour, 60/minute), GitHub Copilot Free (2 000 complétions + 50 requêtes premium/mois) et Cursor Hobby (mêmes ordres de grandeur). Côté APIs, SiliconFlow offre 20 millions de tokens permanents, Alibaba Model Studio 70 millions (fenêtre promotionnelle), Zhipu 20 millions permanents, Groq 14 400 requêtes/jour en free tier permanent.

Outil	Quota gratuit	Compte payant requis	Point fort
Gemini CLI (OAuth)	1 000 req/j, 60/min	Non	Gemini 2.5 Pro/Flash sans carte
Codex CLI	Compte ChatGPT Free (limité)	Non	Sandbox OS, GPT-5.3-Codex
Claude Code	Inclus Pro/Max ou relais API	Oui ou relais	Qualité code maximale
OpenCode	Outil libre, API variable	Non	75+ fournisseurs, 146K stars
OpenClaw	Outil libre, multi-provider	Non	Réutilise OAuth Gemini/Claude
Copilot Free / Student	2 000 compl. / 300 premium (étudiant)	Non	Intégration IDE native
Cursor Hobby	2 000 Tab + 50 premium lents/mois	Non	Expérience VS Code complète

Combiner plusieurs registres API (SiliconFlow + Zhipu + Alibaba) peut couvrir plusieurs mois de développement léger sans facture. L'enjeu professionnel consiste à documenter quel outil consomme quel quota, surtout avant le 18 juin 2026, date pivot pour une partie des utilisateurs Gemini CLI migrés vers Antigravity avec des quotas free fortement réduits selon les annonces Google.

01Gemini CLI : le levier OAuth le plus généreux

Gemini CLI demeure, en juin 2026, la porte d'entrée la plus attractive pour un terminal alimenté par Gemini 2.5 Pro ou Flash sans clé API payante. Prérequis : Node.js 18+, puis npm install -g @google/gemini-cli ou brew install gemini-cli. Au premier lancement (gemini), choisissez « Sign in with Google » : le navigateur gère OAuth, le token est mis en cache localement.

Les limites diffèrent selon le modèle : Gemini 2.5 Pro autorise 100 requêtes/jour via API Studio, Flash jusqu'à 250, Flash-Lite jusqu'à 1 000 — mais le CLI OAuth agrège un plafond global de 1 000 requêtes/jour à 60/minute, bien au-delà de l'usage typique d'un développeur individuel. Commandes utiles : /model pour basculer, /stats model pour suivre la consommation. Attention contractuelle : Google interdit de router le token OAuth vers un proxy tiers ; les équipes entreprise doivent privilégier les clés API officielles ou Gemini Code Assist Enterprise, exemptés de la coupure du 18 juin selon la documentation Google.

02Codex CLI : agent OpenAI en sandbox système

Codex CLI, écrit en Rust et comptant plus de 83 000 stars, occupe la même catégorie que Claude Code : agent terminal avec exécution sandboxée. Installation : npm install -g @openai/codex ou brew install --cask codex. Connexion initiale via OAuth ChatGPT ; les comptes Free bénéficient d'un quota limité dans le temps, Plus/Pro élargissent l'usage.

Pour les équipes sans accès direct OpenAI, le fichier ~/.codex/config.toml accepte un endpoint compatible, par exemple SiliconFlow : openai_base_url = "https://api.siliconflow.cn/v1", model = "deepseek-ai/DeepSeek-V3", sandbox_mode = "workspace-write", approval_policy = "on-request". Définissez OPENAI_API_KEY, validez avec codex doctor, puis lancez des tâches ciblées : codex "Corriger l'erreur de build du module auth". Cette approche transforme les tokens gratuits chinois en moteur Codex sans abonnement ChatGPT.

03Claude Code : excellence payante ou relais économique

Claude Code ne propose pas de tier gratuit permanent : l'accès passe par Claude Pro/Max (à partir de 20 $/mois) ou par un relais Anthropic-compatible. Installation standard : script curl, Homebrew ou npm (@anthropic-ai/claude-code). La commande /model liste les modèles disponibles ; claude --model claude-sonnet-4-6 fixe le défaut au lancement.

Configuration relais dans ~/.claude/settings.json : ANTHROPIC_BASE_URL pointant vers SiliconFlow ou Zhipu GLM-5, plus ANTHROPIC_API_KEY. Règle d'or pour préserver les tokens gratuits : ne jamais lancer /init sur un monorepo entier — un scan complet peut consommer des centaines de milliers de tokens en une session. Privilégiez les fichiers unitaires et documentez les prompts récurrents dans SKILL.md, alignés sur le standard agentskills.io.

04OpenCode et OpenClaw : liberté de fournisseur

OpenCode incarne la philosophie BYOK : curl -fsSL https://opencode.ai/install | bash, puis /connect pour lier Gemini API (1 500 req/j Flash), SiliconFlow (20M tokens), Ollama local (gratuit, RAM-dependent) ou les modèles Zen temporairement gratuits. La touche Tab bascule entre modes Plan et Build ; /models liste l'inventaire.

OpenClaw étend cette logique aux agents multicanaux. Après openclaw onboard --install-daemon, réutilisez l'OAuth Gemini CLI : openclaw models auth login --provider google-gemini-cli --set-default. Pour Anthropic, générez un setup-token via claude setup-token, puis openclaw models auth paste-token --provider anthropic. Le scan OpenRouter (openclaw models scan) détecte les modèles gratuits. Déploiement 7×24 : consultez OpenClaw sur Mac Mini M4 loué.

05GitHub Copilot et Cursor : quotas IDE

GitHub Copilot Free s'active depuis Settings → Copilot pour tout compte GitHub : 2 000 complétions et 50 requêtes premium par mois. Les étudiants certifiés GitHub Education obtiennent Copilot Student, équivalent Pro (~300 requêtes premium/mois, valeur ~10 $). Depuis le 20 avril 2026, vérifiez l'état des inscriptions Pro sur la page officielle — certaines nouvelles activations peuvent être suspendues temporairement.

Cursor Hobby offre 2 000 complétions Tab et 50 requêtes premium lentes par mois, sans carte bancaire. Les étudiants peuvent viser Cursor Pro gratuit un an via cursor.com/students. Suivez la consommation sur app.cursor.sh/account/usage. Pour les workflows agent GitHub, voir le runbook Copilot Coding Agent.

06APIs gratuites : endpoints et bonus d'inscription

SiliconFlow (api.siliconflow.cn/v1) : 20 millions de tokens permanents, modèles DeepSeek-V3, Qwen3.5, GLM-5. Alibaba Model Studio (dashscope.aliyuncs.com/compatible-mode/v1) : 70 millions de tokens promotionnels sur 70+ modèles. Zhipu (open.bigmodel.cn/api/paas/v4) : 20 millions permanents, GLM-5 idéal pour relais Claude. Groq (api.groq.com/openai/v1) : 14 400 req/j permanent, Llama 3.3 et Mixtral — accès souvent via proxy depuis l'Europe. NVIDIA NIM (build.nvidia.com) : free tier permanent après vérification téléphone.

Ces endpoints s'intègrent uniformément via OPENAI_API_KEY et OPENAI_BASE_URL dans Codex, OpenCode ou tout client compatible. OpenRouter complète l'arsenal avec des modèles gratuits permanents ; stratégie de routage dans les tendances LLM juin 2026.

07Dix pratiques pour préserver vos quotas

Interdire /init sur monorepos — Claude Code et Codex peuvent brûler un quota journalier entier en un scan.
Opérer fichier par fichier plutôt que « optimise tout le projet ».
Routage Flash-Lite → Pro : Gemini Flash-Lite (1 000 req/j) pour triage, Pro pour architecture.
Alertes à 80 % sur SiliconFlow, Alibaba et Groq.
Ollama local (ollama pull qwen3:8b) pour formatage et lint sans API.
Prompts système concis dans chaque configuration CLI.
SKILL.md versionnés pour éviter la dérive entre sessions.
Scan OpenRouter via OpenClaw pour modèles gratuits.
Rotation de clés si vous approchez des limites 429.
Veille promotionnelle : les plateformes chinoises lancent régulièrement des campagnes saisonnières.

08Matrice de décision par profil

Profil	Stack recommandé	Quota clé
Développeur terminal occidental	Gemini CLI OAuth	1 000 req/j
Étudiant IDE	Copilot Student + Cursor Edu	0 € Pro-équivalent
Qualité code maximale	Claude Code + relais GLM-5	Tokens Zhipu 20M
Multi-modèles	OpenCode + OpenRouter	BYOK + scan free
Agent 7×24 messagerie	OpenClaw + Hermes	OAuth Gemini réutilisé
CI headless	Codex CLI + DeepSeek relay	SiliconFlow 20M
Souveraineté / offline	Ollama + OpenCode	0 API, RAM 64 Go+

Pour trois à six mois d'expérimentation parallèle, la location Mac cloud horaire sur tarifs évite l'immobilisation CapEx ; fixez ensuite sur commander selon la concurrence d'agents et le nombre de sandboxes Docker.

09Runbook en six étapes : tokens gratuits sur Mac cloud NUKCLOUD

Les quotas gratuits résolvent l'accès aux modèles ; un Mac cloud dédié résout la continuité OAuth, launchd et conformité. Ce runbook complète le guide console NUKCLOUD.

01
Provisionner l'instance : connectez-vous à la console NUKCLOUD, choisissez région et 16 Go pour CLI légers ou 32 Go+ pour OpenClaw/Hermes avec Docker. Importez votre clé SSH et vérifiez le quota disque pour logs OAuth.
02
Baseline SSH : ssh user@votre-mac-cloud, installez Xcode CLI si nécessaire, brew install git node python@3.12. Testez l'accès Google OAuth, GitHub et vos endpoints API.
03
Enregistrer les clés gratuites : créez vos clés SiliconFlow, Groq ou Gemini AI Studio. Exportez dans ~/.zshrc : GEMINI_API_KEY, OPENAI_API_KEY, OPENROUTER_API_KEY. Activez les alertes à 80 % de quota.
04
Installer la stack CLI : Gemini CLI et Codex via npm, OpenCode via curl, OpenClaw via openclaw onboard. Terminez OAuth Gemini dans le navigateur ; exécutez codex doctor et OpenCode /connect.
05
launchd 7×24 : créez ~/Library/LaunchAgents/com.equipe.agent.plist avec RunAtLoad et KeepAlive pour OpenClaw ou Hermes. Centralisez les prompts dans SKILL.md — voir installation Hermes.
06
Revue mensuelle des quotas : Gemini /stats model, dashboards Cursor/Copilot, console SiliconFlow. Si le coût API dépasse durablement la location Mac haute mémoire, optimisez le routage ; sinon fixez la spec. Tarifs : tarifs, commande : commander.

Les VPS macOS mutualisés à la minute provoquent jitter réseau et reset de sessions OAuth — fatal pour des gateways OpenClaw actifs douze heures par jour. Les nœuds Mac cloud dédiés NUKCLOUD offrent une sémantique locataire auditable et une uptime compatible production.

10Questions fréquentes

Gemini CLI est-il entièrement gratuit ?

Oui avec un compte Google standard via OAuth : 1 000 requêtes/jour, 60/minute, sans carte bancaire. Consultez la transition Antigravity du 18 juin 2026 pour les comptes personnels concernés.

Comment obtenir GitHub Copilot étudiant gratuit ?

Certifiez-vous sur GitHub Education avec email .edu ou justificatif. Copilot Student s'active automatiquement avec les mêmes fonctionnalités que Pro.

Cursor gratuit suffit-il pour un usage professionnel léger ?

Pour l'évaluation oui : 2 000 complétions Tab et 50 requêtes premium lentes/mois. Les refactorings lourds ou agents continus nécessitent Pro ou Cursor Student Pro.

Quels outils fonctionnent sans proxy depuis l'Europe ?

Copilot Free, Cursor Hobby, OpenCode avec relais SiliconFlow/Zhipu/Alibaba, Ollama local. Gemini CLI OAuth, Codex OAuth et Groq requièrent généralement un accès aux endpoints US.

Pourquoi déployer sur Mac cloud plutôt que sur un laptop personnel ?

Les tokens OAuth et les agents launchd exigent IP stable, RAM suffisante et disponibilité 7×24. Un Mac cloud NUKCLOUD dédié préserve sessions et gateways de façon auditable — provisionnement via console.