Dernière revue :
Qu'est-ce qu'un modèle IA open source ? Définition et bon réflexe vs mauvais réflexe
Un modèle open source IA est un modèle de fondation dont les poids et l'architecture sont librement téléchargeables et exploitables sous licence permissive (Apache 2.0, MIT). Il s'oppose au modèle propriétaire (Claude, GPT, Gemini) accessible uniquement via API. Le choix engage souveraineté, coût et flexibilité long terme.
Le paysage des modèles open source s'est transformé entre 2023 et 2026. Les modèles propriétaires (Claude d'Anthropic, GPT d'OpenAI, Gemini de Google) conservent une légère avance sur les benchmarks les plus difficiles, mais l'écart se resserre rapidement. Les modèles open source dominants en mai 2026 sont DeepSeek V4 Pro (MIT, Chine), Llama 4 Scout et Maverick (Meta custom license, 10M tokens de contexte), Qwen 3.5 (Apache 2.0, Alibaba, 201 langues), Mistral Large 3 et Medium 3.5 (Apache 2.0, France), et Gemma 4 (Apache 2.0, Google). L'architecture dominante est le MoE sparse : tous les flagships ont entre 397 et 1 600 milliards de paramètres totaux, mais seuls 17 à 49 milliards sont actifs par token. Apache 2.0 et MIT sont les licences les plus permissives ; la Meta custom license impose une clause de seuil utilisateurs (700M MAU) et des restrictions UE.
Exemple concret
Un cabinet d'expertise comptable français de 180 salariés évalue en 2026 le déploiement d'un assistant IA interne sur documents sensibles (bilans clients, déclarations fiscales). Trois options. Option A : Claude Sonnet 4.6 via API Anthropic, hébergement européen Frankfurt, 2 100 $/mois, données transitant par les serveurs Anthropic. Option B : Mistral Large 3 self-hosté sur cluster GPU loué chez Scaleway, 4 800 $/mois (4 GPUs H200 et stockage), données 100 % France. Option C : Mistral Medium 3.5 (24B) sur 2 GPUs A100 self-hostés dans le datacenter du cabinet, 1 200 $/mois après amortissement matériel sur 24 mois, souveraineté complète. Le cabinet choisit l'option C pour la confidentialité fiscale et un TCO inférieur aux deux autres.
À voir aussi
Pour aller plus loin
Sources
- Open-Source LLMs Landscape 2026, Codersera, mise à jour 1er mai 2026 (benchmarks comparés DeepSeek V4 Pro, Llama 4, Qwen 3.5, Mistral Large 3, Gemma 4). https://codersera.com/blog/open-source-llms-landscape-2026/
- Mistral AI documentation officielle, modèles Large 3 et Medium 3.5, Apache 2.0, 2026. https://mistral.ai/