Qwen 3.5, Doubao 2.0, MiniMax M2.5 : la Chine lance sa grande offensive IA autour du Nouvel An lunaire
Profitant des festivités du Printemps, trois géants tech chinois ont dévoilé simultanément des modèles frontières rivalisant avec les meilleures offres occidentales à une fraction du coût
La semaine du 13 au 20 février 2026 restera dans l'histoire de l'intelligence artificielle comme celle de la grande offensive chinoise. En quelques jours, trois entreprises — ByteDance, Alibaba et MiniMax — ont lancé de nouveaux modèles frontières dans ce qui ressemble à une salve coordonnée autour du Nouvel An lunaire, qui débutait le 17 février 2026.
La manœuvre n'est pas anodine. L'an dernier, DeepSeek avait surpris toute l'industrie avec son modèle R1 en plein congé du Printemps. Cette année, les acteurs en place ont pris les devants. ByteDance a dégainé en premier, le 14 février, avec Doubao 2.0, une mise à jour majeure de son application IA la plus utilisée en Chine, forte de 155 millions d'utilisateurs actifs hebdomadaires. La version Pro intègre désormais raisonnement complexe et exécution de tâches multi-étapes, rivalisant avec GPT-5.2 et Gemini 3 Pro tout en réduisant les coûts d'un facteur dix.
Le 16 février, Alibaba a lancé Qwen 3.5, son modèle open-weight le plus ambitieux à ce jour. Le flagship — Qwen3.5-397B-A17B — concentre 397 milliards de paramètres totaux mais n'en active que 17 milliards par token grâce à son architecture Mixture of Experts. Résultat spectaculaire : il s'avère 19 fois plus rapide que son prédécesseur Qwen3-Max, prend en charge 201 langues et dialects, et coûte 60 % moins cher à opérer que la génération précédente. Sur les benchmarks vision-langage (MMMU 85,0, MathVista 90,3), Alibaba revendique des performances supérieures à GPT-5.2, Claude Opus 4.6 et Gemini 3 Pro.
MiniMax a complété ce triptyque avec M2.5 : 230 milliards de paramètres totaux (10B actifs en inférence), un score de 80,2 % sur SWE-bench Verified et une première place mondiale sur Multi-SWE-bench — pour seulement 0,30 USD par million de tokens en entrée, soit environ 1/20e du tarif de Claude Opus 4.6.
Ce déferlement illustre une dynamique de fond : l'architecture MoE, popularisée par Mistral et DeepSeek, est désormais la norme pour concilier puissance et efficience. La compétition ne se joue plus sur la taille brute des paramètres mais sur le ratio performance-coût. Malgré les restrictions d'exportation sur les puces NVIDIA, les laboratoires chinois continuent de former des modèles de niveau frontière, parfois sur du matériel alternatif comme les puces Huawei Ascend.
Pour les développeurs, la fenêtre est immédiate : Qwen 3.5 est disponible en open-weight sur Hugging Face, M2.5 tourne sur Ollama, et Doubao s'intègre via l'API ByteDance. La guerre des modèles se joue désormais autant en yuan qu'en dollar.
Claude Sonnet 4.6 : Anthropic élève son mid-tier au rang de modèle par défaut
Le 17 février 2026, Anthropic a déployé Claude Sonnet 4.6 en remplacement du modèle par défaut sur claude.ai pour tous les utilisateurs Free et Pro. Un geste symboliquement fort : Anthropic reconnaît implicitement que la qualité du mid-tier a rattrapé celle du tier premium de la génération précédente.
Les chiffres parlent d'eux-mêmes. Sur SWE-bench Verified — le benchmark de référence pour l'ingénierie logicielle autonome —, Sonnet 4.6 obtient 79,6 %, contre 80,8 % pour Opus 4.6. Sur OSWorld — benchmark d'interactions UI réelles — il atteint 72,5 %. Ces performances rivalisent avec le fleuron d'Anthropic, à un coût de 3 USD / 15 USD par million de tokens entrée/sortie, soit cinq à sept fois moins cher qu'Opus.
L'autre nouveauté majeure est une fenêtre de contexte d'un million de tokens en beta, ouvrant la voie à l'analyse de codebases entières, de vastes corpus documentaires ou de longues sessions d'agents autonomes. Selon Anthropic, le modèle excelle dans les tâches de computer use et les pipelines d'ingénierie logicielle multi-étapes.
Claude Sonnet 4.6 est également disponible sur Amazon Bedrock. La tendance est claire : la frontière entre modèles premium et intermédiaires s'efface, forçant l'ensemble du marché à repenser sa grille de valeur. Pour les équipes d'ingénierie, Sonnet 4.6 représente probablement le meilleur rapport performance-coût disponible ce mois-ci.
New Delhi accueille le premier sommet IA du Global South
Du 16 au 21 février 2026, New Delhi a accueilli l'India AI Impact Summit 2026 au Bharat Mandapam — premier sommet de la série à être organisé par un pays du Global South. Plus de 100 nations étaient représentées, et au moins 60 ont signé ou annoncé leur intention de signer la Déclaration de Delhi, un cadre de gouvernance non contraignant centré sur trois piliers : personnes, planète, progrès.
L'événement s'inscrit dans la continuité du Sommet IA de Paris (novembre 2025) mais cherche à en élargir la représentation géographique. L'Inde a placé trois enjeux centraux dans les débats : la démocratisation des ressources IA pour les économies émergentes, le développement de modèles performants dans des langues sous-représentées, et l'établissement de mécanismes d'IA sûre et fiable accessibles au Global South.
Le 17 février, la publication d'un AI Compendium — recueil de bonnes pratiques issu de sept groupes de travail thématiques — a constitué l'un des principaux livrables du sommet. Emmanuel Macron, présent lors de sa visite officielle en Inde (17-19 février), a participé aux discussions, renforçant la dimension diplomatique de l'événement.
Un record Guinness a été établi : 250 946 engagements collectés en 24 heures pour une campagne de responsabilité IA (16-17 février). Si l'impact concret reste à mesurer, ce sommet confirme que la gouvernance de l'IA ne peut plus être l'apanage des seuls pays occidentaux. Les nations du Sud global entendent peser dans les standards qui façonneront l'IA des prochaines décennies.
Gemini 3.1 Pro : Google double son score ARC-AGI-2
Le 19 février, Google a lancé Gemini 3.1 Pro avec un score de 77,1 % sur ARC-AGI-2, doublant littéralement son résultat précédent. Premier modèle de la série à recevoir un incrément .1 (au lieu du .5 habituel), il améliore ciblément le raisonnement multi-étapes et les workflows agentiques. Disponible dans Google AI Studio, Vertex AI, NotebookLM et l'app Gemini pour les abonnés AI Pro et Ultra, la tarification reste inchangée à 2 USD par million de tokens en entrée.
Lyria 3 : la génération musicale IA arrive dans l'app Gemini
Le 18 février, Google a intégré Lyria 3 directement dans l'application Gemini. Le modèle génère des pistes musicales de 30 secondes avec paroles à partir d'une description texte, d'une photo ou d'une vidéo, avec contrôle du style, du tempo et des voix. Toutes les créations sont marquées avec SynthID, le filigrane imperceptible de Google pour l'IA. Disponible pour les utilisateurs de 18 ans et plus, en plusieurs langues dont le français.
MiniMax M2.5 : niveau Opus sur SWE-bench à 1/20e du coût
Sorti en mi-février, M2.5 de MiniMax (230B paramètres, 10B actifs) atteint 80,2 % sur SWE-bench Verified — à 0,6 point de Claude Opus 4.6 — et prend la première place de Multi-SWE-bench (51,3 % contre 50,3 % pour Opus). Son tarif : 0,30 USD par million de tokens en entrée, soit environ 1/20e du prix de Claude Opus 4.6. Le modèle est disponible en open-weight via Ollama et HuggingFace.
OpenAI introduit des publicités dans ChatGPT Free et Go
Depuis le 9 février 2026, OpenAI teste des publicités dans ChatGPT pour les utilisateurs des plans Free et Go (8 USD par mois). Les annonces apparaissent hors des réponses du modèle, clairement étiquetées comme contenu sponsorisé. Les plans Plus, Pro, Business, Enterprise et Education restent sans publicité. OpenAI assure que les conversations restent privées vis-à-vis des annonceurs.
Anthropic investit 20 M USD dans le lobbying pro-régulation IA
Le 12 février, Anthropic a annoncé un don de 20 millions de dollars à Public First Action, un groupe de plaidoyer bipartisan qui soutiendra des candidats favorables aux standards fédéraux IA et aux contrôles d'exportation de puces. C'est l'un des plus grands investissements politiques d'un laboratoire IA américain, en opposition directe au PAC Leading the Future, qui prévoit 125 millions USD pour favoriser la déréglementation.
Snyk : le PDG démissionne pour laisser la place à un profil IA
Le 20 février 2026, Peter McKay, PDG de Snyk (sécurité logicielle, 325 M USD de revenus annuels), a annoncé sa démission en invoquant la nécessité d'un dirigeant avec des racines profondes en innovation produit et en IA. Il restera actionnaire significatif jusqu'à l'arrivée de son successeur. Cet épisode illustre comment la vague IA remodèle les équipes dirigeantes des scale-ups tech.
Architecture de réseau neuronal où seul un sous-ensemble de paramètres (les experts) est activé pour chaque token traité. Permet d'avoir les capacités d'un très grand modèle (paramètres totaux) avec le coût computationnel d'un modèle bien plus petit (paramètres actifs). Adoptée cette semaine par Qwen 3.5 (397B/17B actifs), MiniMax M2.5 (230B/10B actifs) et Doubao 2.0.
SWE-bench Verified
Benchmark évaluant la capacité d'un modèle IA à résoudre de vrais problèmes de développement logiciel issus de GitHub (pull requests réelles). Un score élevé indique qu'un modèle peut fonctionner comme agent d'ingénierie autonome. Référence de l'industrie en 2025-2026, avec Claude Opus 4.6 à 80,8 %, MiniMax M2.5 à 80,2 % et Claude Sonnet 4.6 à 79,6 %.
ARC-AGI-2
Seconde version du benchmark ARC-AGI (Abstraction and Reasoning Corpus for Artificial General Intelligence), conçu pour mesurer les capacités de raisonnement abstrait sur des problèmes difficiles pour les machines mais simples pour les humains. Gemini 3.1 Pro a atteint 77,1 % cette semaine, doublant le score précédent de Google.
SynthID
Technologie de filigrane imperceptible développée par Google DeepMind, intégrée dans les contenus générés par les modèles Google (images, audio, vidéo, texte). Permet d'identifier l'origine IA d'un contenu sans le dégrader. Désormais appliquée aux pistes musicales générées par Lyria 3 dans l'app Gemini.
OSWorld
Benchmark évaluant la capacité d'un modèle IA à interagir avec un système d'exploitation réel via son interface graphique (clics, saisies, navigation). Mesure la performance pour les tâches de computer use : accomplir des actions multi-étapes dans des applications réelles comme le ferait un humain. Claude Sonnet 4.6 y obtient 72,5 %.
Computer Use
Capacité d'un modèle IA à contrôler un ordinateur via une interface graphique en voyant des captures d'écran et en effectuant des clics, saisies et navigations. Introduite par Anthropic avec Claude 3.5 Sonnet en 2024, elle est désormais une capacité clé évaluée par OSWorld et améliorée dans Claude Sonnet 4.6.
Déclaration de Delhi
Cadre de gouvernance de l'IA non contraignant adopté lors de l'India AI Impact Summit 2026 (16-21 février). Signé par au moins 60 pays, il établit des principes autour de trois piliers — personnes, planète, progrès — avec un accent sur la démocratisation de l'IA pour les économies émergentes et les langues sous-représentées.
Qwen 3.5
Modèle open-weight d'Alibaba lancé le 16 février 2026. Architecture Mixture of Experts avec 397 milliards de paramètres totaux et 17 milliards actifs (Qwen3.5-397B-A17B). Multimodal natif (texte, image, vidéo), 201 langues supportées, fenêtre de contexte jusqu'à 1 million de tokens dans la version hébergée Qwen3.5-Plus sur Alibaba Cloud.