Glossaire IA pour dirigeants
55 notions pour parler IA en comité de direction, sans jargon ni complaisance. Chaque fiche donne la définition courte, l'exemple concret et l'angle qui compte pour un dirigeant.
Fondamentaux(10)
- EmbeddingUn embedding est la représentation numérique d'un mot, d'une phrase ou d'un document sous forme de vecteur dans un espace à plusieurs centaines ou milliers de dimensions. Deux textes proches sémantiquement ont des embeddings proches géométriquement, ce qui permet la recherche par sens et non par mots-clés.
- EntraînementL'entraînement est la phase de construction d'un modèle d'IA, durant laquelle le modèle ingère un corpus massif et ajuste ses milliards de paramètres internes pour apprendre les régularités statistiques de ce corpus. C'est l'opération la plus coûteuse du cycle de vie d'un modèle.
- IA générativeL'IA générative est une famille de modèles d'intelligence artificielle capables de produire du contenu nouveau (texte, image, son, vidéo, code) à partir d'une instruction en langage naturel, par opposition aux IA traditionnelles qui se limitaient à classer, prédire ou détecter.
- InférenceL'inférence est la phase d'utilisation d'un modèle d'IA, durant laquelle le modèle calcule une réponse à partir d'un prompt donné. C'est l'opération facturée par les fournisseurs d'API, distincte de l'entraînement qui est un coût fixe initial.
- LLM (Large Language Model)Un LLM (Large Language Model) est un type d'intelligence artificielle entraîné sur des corpus de texte de plusieurs centaines de milliards de mots, qui produit du langage naturel en prédisant, mot par mot, la suite la plus probable d'un texte donné.
- Modèle de fondationUn modèle de fondation est un modèle d'IA généraliste entraîné sur des données massives et diversifiées, qui sert de base réutilisable pour des dizaines voire des centaines d'applications métier différentes, par adaptation (fine-tuning, RAG, prompt) plutôt que par entraînement spécifique.
- MultimodalUn modèle d'IA multimodal est un modèle capable de traiter et de produire plusieurs types de contenu simultanément : texte, image, audio, vidéo, code. Le même modèle peut analyser une photo, comprendre une question vocale, lire un document, et répondre par écrit, sans pipeline intermédiaire.
- ParamètreUn paramètre d'un modèle d'IA est une valeur numérique apprise pendant l'entraînement, qui détermine la force des connexions entre neurones artificiels du réseau. Le nombre de paramètres mesure la capacité du modèle à stocker des associations entre les éléments de son corpus d'apprentissage.
- TokenUn token est l'unité élémentaire de texte qu'un modèle d'IA manipule, généralement un fragment de mot équivalent à 3 ou 4 caractères en français. Il est à la fois l'unité de calcul du modèle et l'unité de facturation des fournisseurs d'IA, comptabilisée séparément en entrée et en sortie.
- TransformerLe transformer est l'architecture de réseau de neurones, introduite par Google en 2017, qui sous-tend la quasi-totalité des modèles d'IA générative actuels. Son innovation centrale est le mécanisme d'attention, qui permet au modèle de pondérer dynamiquement l'importance relative des mots dans une séquence.
Interaction et usage(5)
- Fenêtre de contexteLa fenêtre de contexte est la quantité maximale de texte qu'un modèle d'IA peut traiter en une seule requête, mesurée en tokens. Elle inclut le prompt envoyé et la réponse à produire. Au-delà de cette limite, le modèle perd l'accès aux informations les plus anciennes de l'échange.
- HallucinationUne hallucination est une affirmation factuellement fausse mais formulée avec assurance par un modèle d'IA générative. Elle découle du mécanisme statistique de génération : le modèle prédit le mot suivant le plus probable, sans capacité native à vérifier. C'est le principal risque opérationnel et juridique d'un déploiement IA en entreprise.
- PromptUn prompt est l'instruction en langage naturel envoyée à un modèle d'IA pour obtenir une réponse. Sa qualité conditionne directement la qualité, la pertinence et le coût de la sortie générée. Un bon prompt n'est pas long, il est précis, structuré et contextualisé.
- Prompt engineeringLe prompt engineering est la discipline d'écriture méthodique des prompts. Il ne s'agit pas d'un métier rare mais d'une compétence transversale, qui consiste à formaliser, tester et standardiser les instructions adressées à un LLM pour obtenir des sorties fiables et reproductibles à l'échelle d'une organisation.
- Rôles de conversationLes rôles de conversation (système, utilisateur, assistant) sont les étiquettes assignées à chaque message d'un échange avec un LLM. Le rôle système définit le comportement général du modèle, le rôle utilisateur porte les requêtes, le rôle assistant les réponses passées du modèle dans l'historique conversationnel.
Architectures avancées(9)
- API IAUne API IA est une interface technique permettant à une application logicielle d'envoyer des requêtes à un modèle d'IA hébergé par un fournisseur, et de récupérer ses réponses. C'est le mode d'accès standard à l'IA en entreprise, par opposition à l'hébergement local du modèle.
- Base vectorielleUne base vectorielle est une base de données spécialisée dans le stockage et la recherche de vecteurs (embeddings). Elle permet de retrouver, pour une requête donnée, les contenus les plus sémantiquement proches dans un corpus, sans correspondance lexicale exacte. C'est le moteur de recherche typique d'un système RAG.
- DistillationLa distillation est une technique qui consiste à transférer la connaissance d'un grand modèle d'IA (modèle enseignant) vers un modèle plus petit (modèle étudiant), tout en préservant l'essentiel des performances. Elle permet de déployer des modèles légers à coût d'inférence réduit, viables sur des infrastructures plus modestes.
- Fine-tuningLe fine-tuning est une technique d'adaptation d'un modèle d'IA déjà entraîné, qui consiste à poursuivre son entraînement sur un jeu de données spécifique à votre cas d'usage. Il modifie les paramètres internes du modèle, par opposition au RAG qui injecte simplement du contexte au moment de la requête.
- Function callingLe function calling est la capacité d'un modèle d'IA à invoquer des fonctions ou des outils prédéfinis pour exécuter des actions dans un système externe. Le modèle retourne un objet structuré (JSON) plutôt que du texte, permettant à l'application d'appeler la fonction et de réinjecter le résultat dans la conversation.
- MCP (Model Context Protocol)Le MCP (Model Context Protocol) est un standard ouvert, introduit par Anthropic en novembre 2024, qui permet à un modèle d'IA de se connecter à des sources de données et des outils externes de manière uniforme. Il évite l'écriture de connecteurs spécifiques pour chaque combinaison modèle-application.
- Modèle open sourceUn modèle open source IA est un modèle de fondation dont les poids et l'architecture sont librement téléchargeables et exploitables sous licence permissive (Apache 2.0, MIT). Il s'oppose au modèle propriétaire (Claude, GPT, Gemini) accessible uniquement via API. Le choix engage souveraineté, coût et flexibilité long terme.
- MoE (Mixture of Experts)Mixture of Experts (MoE) est une architecture de modèle d'IA qui divise le réseau en sous-modèles spécialisés, appelés experts. À chaque token traité, un routeur sélectionne dynamiquement quelques experts, laissant les autres inactifs. Le modèle a la capacité d'un grand modèle mais le coût de calcul d'un plus petit.
- RAG (Retrieval-Augmented Generation)Le RAG (Retrieval-Augmented Generation) est une architecture d'IA qui couple un moteur de recherche dans vos documents à un modèle génératif : le modèle répond en s'appuyant sur vos données métier citables plutôt que sur ses seules connaissances d'entraînement.
Agents et automatisation(7)
- Agent IAUn agent IA est un système autonome qui combine un modèle de langage avec des outils externes pour exécuter des tâches en plusieurs étapes : il analyse une demande, planifie une séquence d'actions, exécute, observe, et adapte sa stratégie. Il diffère d'un assistant qui se contente de répondre.
- Automatisation augmentéeL'automatisation augmentée est l'usage de l'IA pour assister un travailleur humain dans l'exécution d'une tâche, plutôt que pour le remplacer. L'humain reste décisionnaire et responsable, l'IA accélère, prépare ou valide. C'est le mode dominant en 2026 pour les tâches à enjeu juridique, créatif ou relationnel.
- Boucle agentiqueLa boucle agentique est le cycle itératif d'un agent IA qui agit, observe le résultat, et décide de l'action suivante, jusqu'à atteindre son objectif ou un critère d'arrêt. Sans plafond ni observabilité, elle peut diverger en boucle infinie et consommer en quelques minutes l'équivalent de plusieurs jours d'usage normal.
- CopilotUn copilot IA est un assistant qui suggère, propose et complète des actions à l'utilisateur, qui garde le contrôle de la décision finale et de l'exécution. Il se distingue de l'agent IA, qui exécute en autonomie. Le copilot est un mode d'usage prudent, l'agent un mode d'usage délégué.
- Orchestration d'agentsL'orchestration d'agents IA est la coordination de plusieurs agents spécialisés, chacun responsable d'une partie d'une tâche complexe, pour qu'ils collaborent vers un objectif commun. Un orchestrateur central (ou un agent superviseur) répartit les sous-tâches, supervise leur exécution et agrège les résultats.
- Plateforme d'agent IAUne plateforme d'agent IA est un environnement permettant de créer, déployer et exploiter des agents IA autonomes en entreprise. Trois familles existent en 2026 : SDK développeurs (Claude Agent SDK, LangGraph, AutoGen), plateformes no-code (n8n, Make, Microsoft Copilot Studio), et produits intégrés open source self-hosted (OpenClaw, OpenHands).
- Workflow IAUn workflow IA est l'enchaînement structuré de plusieurs étapes d'inférence d'IA pour accomplir une tâche complexe, généralement avec des outils externes intercalés. Il peut être pré-défini (chaîne linéaire) ou dynamique (orchestré par un agent), et constitue le mode opérationnel dominant des déploiements IA matures en entreprise.
Risques et gouvernance(9)
- AI ActL'AI Act est le règlement européen 2024/1689, premier cadre juridique mondial à classifier les systèmes d'IA par niveau de risque et à imposer des obligations différenciées : interdiction pour les usages inacceptables, exigences strictes pour les systèmes à haut risque, transparence pour les autres.
- AlignementL'alignement est l'ensemble des techniques visant à orienter le comportement d'un modèle d'IA vers les objectifs et les valeurs humaines de son utilisateur ou de son éditeur. Il transforme un modèle brut, capable de tout produire, en un assistant utile, honnête et qui refuse les demandes contraires aux règles fixées.
- Biais algorithmiqueUn biais algorithmique est une déviation systématique d'un modèle d'IA, héritée des données d'entraînement, des choix de conception ou du contexte de déploiement, qui produit des décisions inéquitables ou erronées au détriment d'un groupe de population ou d'un type de cas.
- Données d'entraînementLes données d'entraînement sont l'ensemble des textes, images, codes et autres contenus utilisés pour entraîner un modèle d'IA. Leur composition détermine ce que le modèle sait, ce qu'il ignore, ses biais et ses risques juridiques. Une partie majeure du contentieux IA actuel porte sur leur provenance et leur licéité.
- Empreinte carbone de l'IAL'empreinte carbone de l'IA est l'ensemble des émissions de gaz à effet de serre liées à son cycle de vie : entraînement des modèles, fabrication des composants, fonctionnement des data centres et inférence à l'usage. Elle devient un poste de consommation significatif à l'échelle mondiale.
- Garde-fousLes garde-fous sont des couches techniques de contrôle, ajoutées en entrée ou en sortie d'un modèle d'IA, qui détectent et bloquent les comportements indésirables : prompts malveillants, fuites de données, contenus interdits. Ils sont distincts de l'alignement, qui agit sur le comportement par défaut du modèle lui-même.
- Red teamingLe red teaming, emprunté à la cybersécurité, est la pratique de tester un système d'IA en simulant des tentatives d'usage adverse : contournement des règles, extraction de données sensibles, génération de contenus interdits. Il vise à identifier les vulnérabilités avant qu'un acteur malveillant ne les exploite en production.
- RGPD et IALe RGPD encadre tout traitement de données personnelles par un système d'IA opéré en Europe ou concernant des Européens. Quatre obligations s'appliquent en priorité : finalité explicite, minimisation des données, droits d'accès et d'opposition, et étude d'impact pour les traitements à risque élevé.
- Souveraineté numériqueLa souveraineté numérique est la capacité d'une entreprise ou d'un État à maîtriser ses données, ses infrastructures et ses outils IA, indépendamment de juridictions étrangères. Elle conditionne la confidentialité, la conformité réglementaire et la résilience aux ruptures d'accès dictées par des décisions politiques externes.
Business et adoption(8)
- Cas d'usage IAUn cas d'usage IA est une application concrète de l'intelligence artificielle à un processus métier identifié, avec un objectif mesurable et un périmètre délimité. Les trois cas les plus déployés en entreprise en 2026 sont l'assistance au développement logiciel, le service client, et l'analyse de données.
- Coût par tokenLe coût par token est l'unité économique élémentaire d'un déploiement IA. Les fournisseurs facturent séparément les tokens en entrée (votre prompt) et en sortie (la réponse du modèle), avec un ratio typique de 1 pour 5. Maîtriser ce coût exige de distinguer tarifs unitaires, volumes, et leviers d'optimisation.
- Discipline d'usageLa discipline d'usage IA est l'ensemble des règles, méthodes et habitudes par lesquelles une entreprise oriente l'usage quotidien de l'IA par ses collaborateurs : quels cas d'usage activer, comment formuler les demandes, quels modèles utiliser, comment auditer les sorties. C'est le levier dominant du retour réel d'un déploiement IA.
- POC IAUn POC IA (proof of concept) est un projet pilote court visant à tester la faisabilité technique et la valeur métier d'une application d'IA avant tout investissement industriel. Selon RAND 2025, 80,3 % des POC IA échouent à délivrer leur valeur business attendue.
- Productivité augmentéeLa productivité augmentée par l'IA désigne les gains de production mesurables (volume traité, vitesse, qualité) qu'un travailleur réalise lorsqu'il bénéficie d'une assistance d'IA générative. Les études en conditions réelles montrent un gain moyen de 14 à 15 %, fortement concentré sur les profils les moins expérimentés.
- ROI IALe ROI IA, calqué sur le ROI financier classique, est une métrique trompeusement séduisante pour évaluer un déploiement d'IA. Trois confusions structurelles l'invalident : sous-évaluation des coûts cachés, absence de baseline pré-IA robuste, et concentration sur l'efficience opérationnelle au détriment des deux autres dimensions de valeur.
- Shadow AILe shadow AI désigne l'usage de modèles d'IA générative par des collaborateurs sans validation ni cadrage de leur entreprise. Largement répandu en 2025-2026, il crée des risques juridiques, financiers (fuite de données métier vers les modèles publics), et de qualité (sorties non auditées intégrées à des livrables clients).
- TCO IALe TCO IA (total cost of ownership) est le coût total réel d'un déploiement d'IA en entreprise, agrégeant cinq postes : modèle d'inférence, infrastructure, intégration applicative, supervision opérationnelle, et coût équipe. Selon RAND 2025, les surcoûts en production atteignent en moyenne 380 % des estimations pilote.
SEO et GEO(7)
- AEO (Answer Engine Optimization)L'AEO (Answer Engine Optimization) est une sous-discipline du GEO, focalisée sur la production de réponses directes aux questions des utilisateurs. Elle vise les moteurs de réponse (Google AI Overviews, ChatGPT, Perplexity) qui exigent une réponse concise, sourcée, et restituable telle quelle, plutôt qu'une page à parcourir.
- CitabilitéLa citabilité est la propriété d'un contenu d'être extrait, restitué et attribué tel quel par un moteur d'IA dans sa réponse à un utilisateur. Elle se construit par la rédaction (phrases autoportantes), le balisage (Schema.org), et l'autorité topique (cohérence et densité éditoriale sur un domaine). C'est l'objectif central du GEO.
- GEO (Generative Engine Optimization)Le GEO (Generative Engine Optimization) est l'ensemble des pratiques visant à rendre un contenu identifiable, fiable et citable par les moteurs de réponse génératifs (ChatGPT, Claude, Perplexity, Gemini, Google AI Overviews). Il succède au SEO traditionnel quand les utilisateurs cherchent des réponses, pas des liens.
- Indexation conversationnelleL'indexation conversationnelle est le processus par lequel les moteurs IA construisent leurs réponses à partir de contenus web : ingestion en entraînement (corpus daté), récupération à l'inférence (RAG via web search), ou les deux combinés. Elle remplace l'indexation par mots-clés des moteurs classiques par une indexation par questions et intentions.
- llms.txtLe llms.txt est une proposition de standard web introduite en septembre 2024 par Answer.AI, fournissant aux modèles d'IA une carte structurée des contenus d'un site. Placé à la racine du domaine, il n'est pas un standard formel et son adoption par les LLM majeurs reste inégale en 2026.
- Référence générativeLa référence générative est la mention d'une source dans la réponse d'un moteur d'IA à un utilisateur : citation textuelle, attribution explicite, ou lien hypertexte vers le contenu original. Elle remplace progressivement le lien organique classique comme signal de visibilité éditoriale et de marque sur le web.
- Schema.org pour l'IASchema.org est un vocabulaire standard de balisage sémantique structuré (JSON-LD le plus souvent) que les moteurs IA utilisent pour comprendre la nature d'une page web : terme défini, FAQ, article, produit, événement. Bien implémenté, il multiplie par deux à quatre la probabilité d'être cité par les moteurs de réponse génératifs.