Classement OpenRouter juin 2026 : les modèles chinois prennent le relais — sur quoi parier au second semestre ?

Trafic réel sur OpenRouter : DeepSeek mène avec 5,13 T de tokens hebdomadaires ; le trio américain est passé de 70 % à 30 % de parts en un an. Claude Opus 4.8 conserve l'indice qualité 61,4 — volume numéro un n'est pas qualité numéro un.

Si vous cherchez le classement OpenRouter 2026, la comparaison DeepSeek V4 Flash vs Claude Opus 4.8, ou des prévisions de modèles IA au second semestre 2026, cet article couvre l'intégralité du sujet : double classement entreprises/modèles en juin ; bascule macro 70 % → 30 % pour les modèles US ; lecture en deux niveaux volume vs qualité ; retrait mondial de Claude Fable 5 ; trois leviers de rapport qualité-prix des modèles chinois ; matrice de choix sur huit scénarios ; tableau de prévisions Q3 et cinq tendances macro ; compression des marges et architecture agnostique au modèle ; matrice de décision et runbook NUKCLOUD en six étapes. À lire en parallèle : tendances LLM OpenRouter, vérité des factures hebdomadaires et analyse du retrait Fable 5.

00Classement OpenRouter juin : entreprises et Top 10 modèles

OpenRouter est l'une des sources les plus fiables sur l'usage réel des modèles IA : des millions d'appels agrégés, sans discours marketing — seul compte le vote du code en production. Sources : OpenRouter Rankings, Artificial Analysis Intelligence Index, SWE-bench Pro.

Classement par entreprise (tokens hebdomadaires, fin juin 2026) :

RangEntrepriseOrigineTokens / semainePart de marché
1DeepSeekChine5,13 T17,6 %
2AnthropicÉtats-Unis4,34 T14,8 %
3GoogleÉtats-Unis3,66 T12,5 %
4OpenAIÉtats-Unis2,46 T8,4 %
5XiaomiChine2,42 T8,3 %
6MiniMaxChine2,37 T8,1 %
7TencentChine2,36 T8,1 %
8Alibaba QwenChine1,26 T4,3 %

Les modèles chinois représentent environ 46 % du Top 8 (fabricants chinois identifiés) ; au niveau du trafic développeur global, la barre des 60 % est franchie.

Classement par modèle (tokens quotidiens moyens, Top 10) :

RangModèleÉditeurTokens / jour
1DeepSeek V4 FlashDeepSeek619 B
2Hy3 PreviewTencent451 B
3MiniMax M3MiniMax447 B
4MiMo-V2.5Xiaomi327 B
5DeepSeek V4 ProDeepSeek300 B
6Claude Opus 4.7Anthropic263 B
7Claude Opus 4.8Anthropic~200 B
8Claude Sonnet 4.6Anthropic178 B
9Gemini 3 Flash PreviewGoogle156 B
10Kimi K2.6Moonshot AI~150 B

Ce tableau ne dit pas seulement « qui consomme le plus » : il indique quel modèle les développeurs du monde entier font réellement tourner en production.

痛点Cinq pièges en lisant un classement OpenRouter

  • Confondre volume et qualité : 619 B de tokens/jour pour DeepSeek V4 Flash ne signifie pas qu'il dépasse Claude Opus 4.8 — la majorité provient de complétions quotidiennes et de routage à faible coût.
  • Oublier l'export control : Claude Fable 5 avait obtenu une note qualité maximale, puis a été retiré mondialement mi-juin 2026 pour contrôle des exportations — le meilleur modèle n'est pas toujours disponible.
  • Verrouiller un seul fournisseur API : OpenAI et Anthropic ont tous deux évoqué une IPO en juin ; après cotation, tarifs et tiers peuvent bouger fortement.
  • Angle mort conformité entreprise : les modèles chinois progressent chez les développeurs individuels, mais les achats Fortune 500 restent contraints par la sécurité des données et la surveillance du Congrès US.
  • Sous-estimer le champ Agent : le rapport Anthropic « State of AI Agents 2026 » estime que près de 44 % des appels Claude API concernent maths et informatique — au second semestre, la bataille se joue sur la stabilité des agents longue durée.

01Le basculement majeur : de 70 % à 30 % pour les modèles US en un an

Les données OpenRouter citées par Bloomberg et Exponential View sont limpides :

  • Juin 2025 : les modèles US (Google + OpenAI + Anthropic) représentaient environ 70 % des tokens sur OpenRouter
  • Juin 2026 : ce chiffre est tombé à 30 %

Où sont passés les 40 points perdus ? Absorbés par les modèles chinois. Ce n'est pas un effet « soutien national » : la base OpenRouter est mondiale — États-Unis, Europe, Inde. DeepSeek, Xiaomi et MiniMax sont choisis parce qu'ils sont bon marché, rapides et suffisants pour la charge quotidienne.

Témoignage d'un développeur à San Diego : « Avec Claude pour coder, je dépense environ 10 USD de l'heure. Avec DeepSeek, moins de 50 cents. »

Ce n'est pas une histoire de qualité pure, c'est une histoire d'économie. Juin 2026 a aussi vu le retrait de Claude Fable 5 et les rumeurs d'IPO chez OpenAI et Anthropic. Si vous raisonnez encore avec le cadre de 2025, vos décisions reposent sur des hypothèses déjà obsolètes.

02Deux niveaux de lecture : « premier au volume » ≠ « premier en qualité »

Plafond qualité : Claude Opus 4.8 reste numéro un en capacité globale (Artificial Analysis Intelligence Index, fin mai 2026) :

ModèleIndice qualitéSWE-bench ProNotes
Claude Opus 4.861,4 (#1)69,2 %Contexte long et agents en tête
GPT-5.559–6063,1 %Écosystème le plus riche, tool calling rapide
Gemini 3.1 Pro57Fort sur le raisonnement difficile
Qwen 3.7 Max57Représentant chinois closed-source
Claude Sonnet 4.680,8 % (SWE-bench Verified)Rédaction et suivi d'instructions

Sur 20 tâches comparées en conditions réelles, un ingénieur rapporte : Opus 4.8 en gagne 16, GPT-5.5 en gagne 5, Gemini 3.1 Pro en gagne 4. Sur le contexte long, Opus reste nettement au-dessus.

Claude Fable 5 avait atteint la note maximale (100/100) et environ 95 % sur SWE-bench Verified, avant retrait mondial mi-juin 2026 pour export control — statut encore incertain. Son existence confirme que les modèles US de pointe restent en tête sur la pure capacité.

Champions du volume : les modèles chinois dominent le quotidien par le rapport qualité-prix, selon trois logiques :

  1. Prix : MiniMax M3 à 0,60 USD/M tokens en entrée, soit environ 1/8 de Claude Opus 4.8 (5,00 USD/M)
  2. Suffisance : pour complétion, traduction et résumé, les modèles chinois atteignent souvent 80–90 % de l'effet des modèles premium
  3. Poids ouverts : DeepSeek V4, MiniMax M3 et autres permettent l'auto-hébergement — voir le runbook d'inférence locale ds4
Stack décrite par un développeur à Dallas : « Environ 500 USD/mois Claude + ChatGPT pour les tâches complexes ; MiniMax + Kimi + MiMo à ~200 USD pour le code quotidien et la reconnaissance vocale — 90 % du volume passe par la route économique. »

03Matrice de choix par scénario (juin 2026)

ScénarioModèle recommandéRaison
Code complexe / AgentClaude Opus 4.8Capacité globale #1, contexte long inégalé
Assistance code quotidienneDeepSeek V4 Flash / MiMo-V2.5Rapport qualité-prix et latence
API ultra-compétitiveMiniMax M30,60 USD/M, poids ouverts, auto-hébergement
Contexte très longKimi K2.6 (1M context)Fenêtre étendue, tarif raisonnable
Intégration GoogleGemini 3.5 FlashSupport natif Google Workspace
Recherche Web temps réelGrok 4.3Accès contenu X/Twitter en direct
Déploiement localGLM 5.2 / Kimi K2.6Poids ouverts de premier plan
Génération d'imagesChatGPT Images 2.0Rendu texte dans l'image le plus fiable
Dialogue généralisteGPT-5.5−52,5 % d'hallucinations vs GPT-5.3, écosystème mature

04Prévisions second semestre : Q3 « saison des lancements » et cinq tendances macro

Le Q3 2026 pourrait être le trimestre le plus dense en sorties de modèles de l'histoire de l'IA. Prévisions à confiance élevée :

ModèleÉditeurCalendrier estiméPoints clés
GPT-6OpenAIaoût–sept. 2026Contexte plus long (rumeur 1,5M tokens), agents renforcés
Claude Opus 5Anthropicvers sept. 2026Successeur d'Opus 4.8, agents longue durée
Gemini 4GoogleQ3 2026Multimodal, vidéo et audio renforcés
DeepSeek V5DeepSeekQ3 2026Poids ouverts, >1T paramètres, visée closed-source
GLM 5.2Z.ai (智谱)Déjà publiéPoids ouverts top tier, code très solide
Grok 4.3+xAIQ3 20261M contexte, Web temps réel amélioré

Trois lancements majeurs pourraient se concentrer dans une fenêtre de six semaines entre mi-août et fin septembre — le trône des benchmarks changera plus vite que les cycles médias.

Cinq tendances macro :

  • De « qui est le plus fort » à « qui convient à ce scénario » : cinq labs en 90 jours — stratégie rationnelle : closed-source pour les 5 % les plus durs, poids chinois ouverts pour les 95 % du volume quotidien.
  • Part chinoise en hausse, plafond conformité entreprise : OpenRouter côté indépendants pourrait dépasser 70 % ; achats Fortune 500 difficilement au-delà de 30 %.
  • L'Agent est le vrai champ de bataille : 2026 marque le passage « expérimentation → production » ; SWE-bench Pro, OSWorld-Verified et taux de complétion longue durée décident des contrats.
  • Double IPO OpenAI / Anthropic : les intentions de juin revalorisent le secteur ; après cotation, tarification plus transparente mais aussi guerre des prix avec les modèles chinois — voir IPO Anthropic et financement OpenAI.
  • Local sur matériel grand public : d'ici 2027, un modèle local sur GPU 32 Go pourrait dépasser 80 % sur SWE-bench Verified.

05Conclusion : compression des marges et trois trajectoires US

L'histoire est celle d'une compression rapide des marges sur la couche modèle. DeepSeek, début 2025, a montré qu'un modèle de pointe n'exige pas forcément un compute de pointe. Xiaomi, Tencent, MiniMax et Moonshot ont reproduit la dynamique : le « bon assez » coûte 8 à 30 fois moins que le premium, et la majorité des charges production tournent très bien sur « bon assez ».

Les éditeurs US se scindent :

  • OpenAI mise sur l'écosystème (plugins, intégrations enterprise, DALL-E, Codex Mobile)
  • Anthropic défend le sommet qualité (capacités Agent d'Opus difficiles à égaler)
  • Google privilégie vitesse et multimodal (Gemini Flash parmi les meilleurs closed-source en rapport qualité-prix)

La zone « qualité correcte mais prix élevé » disparaît. Pour un développeur ou un décideur technique, la compétence la plus rentable n'est plus de choisir le modèle le plus fort, mais de construire une architecture capable de changer de modèle à la volée — le numéro un d'aujourd'hui peut ne plus l'être dans trois mois. La vague Q3 2026 le rappellera à tous.

06Runbook en six étapes : workflow IA agnostique sur Mac cloud

  1. 01
    Cartographier les niveaux de tâche : séparer le « 5 % frontier » (Opus 4.8 / GPT-5.5) du « 95 % quotidien » (DeepSeek V4 Flash / MiniMax M3 / MiMo-V2.5) ; aligner avec le classement outils CLI OpenRouter pour Hermes / Claude Code.
  2. 02
    Passerelle LiteLLM / OpenRouter : configurer fallback multi-modèles sur le nœud d'évaluation ; prévoir un chemin Opus 4.8 si Fable 5 ou d'autres modèles soumis à export control disparaissent.
  3. 03
    Provisionner un Mac cloud : se connecter à la console NUKCLOUD, choisir 32 Go+ de mémoire unifiée pour inférence locale et sessions Agent longues ; essai horaire sur la page tarifs avec Kimi K2.6 / GLM 5.2 auto-hébergés.
  4. 04
    Modéliser le TCO : comparer « stack 100 % Claude » vs « Claude frontier + modèles chinois quotidiens » vs « Mac dédié Agent 7×24 » ; intégrer une éventuelle hausse de tiers post-IPO.
  5. 05
    Conformité et résidence des données : mettre à jour les questionnaires fournisseurs (export control, revue congressionnelle) ; côté individuel, privilégier poids ouverts auto-hébergés pour la confidentialité.
  6. 06
    Agent 7×24 via launchd : après pilote, verrouiller la spec sur commander ; détails dans le runbook production et le centre d'aide.

Faire tourner des boucles Agent multi-modèles sur MacBook local ou VPS mutualisé expose souvent à interruption au verrouillage, jitter réseau coupant le SSE, facture API qui explose avec les tokens. Quand une équipe a besoin d'une présence 7×24 stable et d'un routage OpenRouter interchangeable, les nœuds Mac bare metal multirégion NUKCLOUD alignent plus facilement frontière locataire et élasticité de spec avec le rythme des lancements Q3.

07FAQ : classement OpenRouter juin 2026

Quel est le modèle IA le plus utilisé sur OpenRouter en juin 2026 ?
Par tokens quotidiens moyens, DeepSeek V4 Flash mène avec environ 619 B, suivi de Hy3 Preview (Tencent, 451 B) et MiniMax M3 (447 B).
DeepSeek est-il meilleur que Claude ?
Cela dépend du scénario. DeepSeek domine volume et prix ; Claude Opus 4.8 reste #1 avec un indice 61,4 sur les tâches code complexe et contexte long. Quotidien : DeepSeek ; 5 % les plus difficiles : Opus.
Quelle part occupent les modèles chinois sur OpenRouter ?
Environ 46 % des tokens hebdomadaires du Top entreprises pour les fabricants chinois ; trafic développeur global au-delà de 60 %. Le trio US (Google + OpenAI + Anthropic) est passé d'environ 70 % (juin 2025) à 30 % (juin 2026).
Qu'est-il arrivé à Claude Fable 5 ?
Fable 5 avait obtenu 100/100 en qualité, puis a été retiré mondialement mi-juin 2026 pour export control US — statut incertain. Voir l'analyse du retrait.
Quels modèles frontier arrivent au Q3 2026 ?
Fortes probabilités : OpenAI GPT-6 (août–sept.), Anthropic Claude Opus 5 (vers sept.), Google Gemini 4, DeepSeek V5 (poids ouverts, ~1T paramètres) et xAI Grok 4.3+.
L'API MiniMax M3 vaut-elle le coup ?
Entrée à 0,60 USD/M, environ 1/8 du prix d'Opus 4.8 ; poids ouverts et auto-hébergement possibles — adapté aux API production à ultra bon rapport qualité-prix et à l'assistance code quotidienne.
Quel IA pour programmer en 2026 ?
Agent complexe / contexte long : Claude Opus 4.8 ; complétion quotidienne : DeepSeek V4 Flash ou MiMo-V2.5 ; API économique : MiniMax M3 ; benchmark Verified : Claude Sonnet 4.6 (SWE-bench Verified 80,8 %).
Pourquoi ne pas parier sur un seul modèle ?
Plusieurs frontier arrivent en six semaines au Q3 ; export control, IPO et guerre des prix modifient disponibilité et coût. La compétence clé est une architecture de routage agnostique, pas un verrou fournisseur.

Rédigé le 1er juillet 2026 ; données arrêtées fin juin 2026. Ne constitue pas un conseil en investissement. Références : OpenRouter Rankings, Artificial Analysis, rapport Agents Anthropic 2026.