Actualités IA de la semaine

Qwen 3.5, Doubao 2.0, MiniMax M2.5 : la Chine lance sa grande offensive IA autour du Nouvel An lunaire

Profitant des festivités du Printemps, trois géants tech chinois ont dévoilé simultanément des modèles frontières rivalisant avec les meilleures offres occidentales à une fraction du coût

La semaine du 13 au 20 février 2026 restera dans l'histoire de l'intelligence artificielle comme celle de la grande offensive chinoise. En quelques jours, trois entreprises — ByteDance, Alibaba et MiniMax — ont lancé de nouveaux modèles frontières dans ce qui ressemble à une salve coordonnée autour du Nouvel An lunaire, qui débutait le 17 février 2026.

La manœuvre n'est pas anodine. L'an dernier, DeepSeek avait surpris toute l'industrie avec son modèle R1 en plein congé du Printemps. Cette année, les acteurs en place ont pris les devants. ByteDance a dégainé en premier, le 14 février, avec Doubao 2.0, une mise à jour majeure de son application IA la plus utilisée en Chine, forte de 155 millions d'utilisateurs actifs hebdomadaires. La version Pro intègre désormais raisonnement complexe et exécution de tâches multi-étapes, rivalisant avec GPT-5.2 et Gemini 3 Pro tout en réduisant les coûts d'un facteur dix.

Le 16 février, Alibaba a lancé Qwen 3.5, son modèle open-weight le plus ambitieux à ce jour. Le flagship — Qwen3.5-397B-A17B — concentre 397 milliards de paramètres totaux mais n'en active que 17 milliards par token grâce à son architecture Mixture of Experts. Résultat spectaculaire : il s'avère 19 fois plus rapide que son prédécesseur Qwen3-Max, prend en charge 201 langues et dialects, et coûte 60 % moins cher à opérer que la génération précédente. Sur les benchmarks vision-langage (MMMU 85,0, MathVista 90,3), Alibaba revendique des performances supérieures à GPT-5.2, Claude Opus 4.6 et Gemini 3 Pro.

MiniMax a complété ce triptyque avec M2.5 : 230 milliards de paramètres totaux (10B actifs en inférence), un score de 80,2 % sur SWE-bench Verified et une première place mondiale sur Multi-SWE-bench — pour seulement 0,30 USD par million de tokens en entrée, soit environ 1/20e du tarif de Claude Opus 4.6.

Ce déferlement illustre une dynamique de fond : l'architecture MoE, popularisée par Mistral et DeepSeek, est désormais la norme pour concilier puissance et efficience. La compétition ne se joue plus sur la taille brute des paramètres mais sur le ratio performance-coût. Malgré les restrictions d'exportation sur les puces NVIDIA, les laboratoires chinois continuent de former des modèles de niveau frontière, parfois sur du matériel alternatif comme les puces Huawei Ascend.

Pour les développeurs, la fenêtre est immédiate : Qwen 3.5 est disponible en open-weight sur Hugging Face, M2.5 tourne sur Ollama, et Doubao s'intègre via l'API ByteDance. La guerre des modèles se joue désormais autant en yuan qu'en dollar.

CNBC — Alibaba Qwen3.5 · VentureBeat — Qwen 3.5 · CNBC — China AI Lunar New Year War · VentureBeat — MiniMax M2.5

Claude Sonnet 4.6 : Anthropic élève son mid-tier au rang de modèle par défaut

Le 17 février 2026, Anthropic a déployé Claude Sonnet 4.6 en remplacement du modèle par défaut sur claude.ai pour tous les utilisateurs Free et Pro. Un geste symboliquement fort : Anthropic reconnaît implicitement que la qualité du mid-tier a rattrapé celle du tier premium de la génération précédente.

Les chiffres parlent d'eux-mêmes. Sur SWE-bench Verified — le benchmark de référence pour l'ingénierie logicielle autonome —, Sonnet 4.6 obtient 79,6 %, contre 80,8 % pour Opus 4.6. Sur OSWorld — benchmark d'interactions UI réelles — il atteint 72,5 %. Ces performances rivalisent avec le fleuron d'Anthropic, à un coût de 3 USD / 15 USD par million de tokens entrée/sortie, soit cinq à sept fois moins cher qu'Opus.

L'autre nouveauté majeure est une fenêtre de contexte d'un million de tokens en beta, ouvrant la voie à l'analyse de codebases entières, de vastes corpus documentaires ou de longues sessions d'agents autonomes. Selon Anthropic, le modèle excelle dans les tâches de computer use et les pipelines d'ingénierie logicielle multi-étapes.

Claude Sonnet 4.6 est également disponible sur Amazon Bedrock. La tendance est claire : la frontière entre modèles premium et intermédiaires s'efface, forçant l'ensemble du marché à repenser sa grille de valeur. Pour les équipes d'ingénierie, Sonnet 4.6 représente probablement le meilleur rapport performance-coût disponible ce mois-ci.

Anthropic — Introducing Claude Sonnet 4.6 · TechCrunch — Anthropic releases Sonnet 4.6 · VentureBeat — Sonnet 4.6 enterprise adoption

New Delhi accueille le premier sommet IA du Global South

Du 16 au 21 février 2026, New Delhi a accueilli l'India AI Impact Summit 2026 au Bharat Mandapam — premier sommet de la série à être organisé par un pays du Global South. Plus de 100 nations étaient représentées, et au moins 60 ont signé ou annoncé leur intention de signer la Déclaration de Delhi, un cadre de gouvernance non contraignant centré sur trois piliers : personnes, planète, progrès.

L'événement s'inscrit dans la continuité du Sommet IA de Paris (novembre 2025) mais cherche à en élargir la représentation géographique. L'Inde a placé trois enjeux centraux dans les débats : la démocratisation des ressources IA pour les économies émergentes, le développement de modèles performants dans des langues sous-représentées, et l'établissement de mécanismes d'IA sûre et fiable accessibles au Global South.

Le 17 février, la publication d'un AI Compendium — recueil de bonnes pratiques issu de sept groupes de travail thématiques — a constitué l'un des principaux livrables du sommet. Emmanuel Macron, présent lors de sa visite officielle en Inde (17-19 février), a participé aux discussions, renforçant la dimension diplomatique de l'événement.

Un record Guinness a été établi : 250 946 engagements collectés en 24 heures pour une campagne de responsabilité IA (16-17 février). Si l'impact concret reste à mesurer, ce sommet confirme que la gouvernance de l'IA ne peut plus être l'apanage des seuls pays occidentaux. Les nations du Sud global entendent peser dans les standards qui façonneront l'IA des prochaines décennies.

India AI Impact Summit · PIB Inde — communiqué officiel · Time — India AI Summit big names little impact

Glossaire

Mixture of Experts (MoE)

Architecture de réseau neuronal où seul un sous-ensemble de paramètres (les experts) est activé pour chaque token traité. Permet d'avoir les capacités d'un très grand modèle (paramètres totaux) avec le coût computationnel d'un modèle bien plus petit (paramètres actifs). Adoptée cette semaine par Qwen 3.5 (397B/17B actifs), MiniMax M2.5 (230B/10B actifs) et Doubao 2.0.

SWE-bench Verified

Benchmark évaluant la capacité d'un modèle IA à résoudre de vrais problèmes de développement logiciel issus de GitHub (pull requests réelles). Un score élevé indique qu'un modèle peut fonctionner comme agent d'ingénierie autonome. Référence de l'industrie en 2025-2026, avec Claude Opus 4.6 à 80,8 %, MiniMax M2.5 à 80,2 % et Claude Sonnet 4.6 à 79,6 %.

ARC-AGI-2

Seconde version du benchmark ARC-AGI (Abstraction and Reasoning Corpus for Artificial General Intelligence), conçu pour mesurer les capacités de raisonnement abstrait sur des problèmes difficiles pour les machines mais simples pour les humains. Gemini 3.1 Pro a atteint 77,1 % cette semaine, doublant le score précédent de Google.

SynthID

Technologie de filigrane imperceptible développée par Google DeepMind, intégrée dans les contenus générés par les modèles Google (images, audio, vidéo, texte). Permet d'identifier l'origine IA d'un contenu sans le dégrader. Désormais appliquée aux pistes musicales générées par Lyria 3 dans l'app Gemini.

OSWorld

Benchmark évaluant la capacité d'un modèle IA à interagir avec un système d'exploitation réel via son interface graphique (clics, saisies, navigation). Mesure la performance pour les tâches de computer use : accomplir des actions multi-étapes dans des applications réelles comme le ferait un humain. Claude Sonnet 4.6 y obtient 72,5 %.

Computer Use

Capacité d'un modèle IA à contrôler un ordinateur via une interface graphique en voyant des captures d'écran et en effectuant des clics, saisies et navigations. Introduite par Anthropic avec Claude 3.5 Sonnet en 2024, elle est désormais une capacité clé évaluée par OSWorld et améliorée dans Claude Sonnet 4.6.

Déclaration de Delhi

Cadre de gouvernance de l'IA non contraignant adopté lors de l'India AI Impact Summit 2026 (16-21 février). Signé par au moins 60 pays, il établit des principes autour de trois piliers — personnes, planète, progrès — avec un accent sur la démocratisation de l'IA pour les économies émergentes et les langues sous-représentées.

Qwen 3.5

Modèle open-weight d'Alibaba lancé le 16 février 2026. Architecture Mixture of Experts avec 397 milliards de paramètres totaux et 17 milliards actifs (Qwen3.5-397B-A17B). Multimodal natif (texte, image, vidéo), 201 langues supportées, fenêtre de contexte jusqu'à 1 million de tokens dans la version hébergée Qwen3.5-Plus sur Alibaba Cloud.

Actualités IA de la semaine

Qwen 3.5, Doubao 2.0, MiniMax M2.5 : la Chine lance sa grande offensive IA autour du Nouvel An lunaire

Profitant des festivités du Printemps, trois géants tech chinois ont dévoilé simultanément des modèles frontières rivalisant avec les meilleures offres occidentales à une fraction du coût

Claude Sonnet 4.6 : Anthropic élève son mid-tier au rang de modèle par défaut

New Delhi accueille le premier sommet IA du Global South

Gemini 3.1 Pro : Google double son score ARC-AGI-2

Lyria 3 : la génération musicale IA arrive dans l'app Gemini

MiniMax M2.5 : niveau Opus sur SWE-bench à 1/20e du coût

OpenAI introduit des publicités dans ChatGPT Free et Go

Anthropic investit 20 M USD dans le lobbying pro-régulation IA

Snyk : le PDG démissionne pour laisser la place à un profil IA

Glossaire