Fondamentaux
Le socle de vocabulaire pour parler IA en comité de direction. Sans ces notions partagées, le reste du glossaire se lit à moitié.
- EmbeddingUn embedding est la représentation numérique d'un mot, d'une phrase ou d'un document sous forme de vecteur dans un espace à plusieurs centaines ou milliers de dimensions. Deux textes proches sémantiquement ont des embeddings proches géométriquement, ce qui permet la recherche par sens et non par mots-clés.
- EntraînementL'entraînement est la phase de construction d'un modèle d'IA, durant laquelle le modèle ingère un corpus massif et ajuste ses milliards de paramètres internes pour apprendre les régularités statistiques de ce corpus. C'est l'opération la plus coûteuse du cycle de vie d'un modèle.
- IA générativeL'IA générative est une famille de modèles d'intelligence artificielle capables de produire du contenu nouveau (texte, image, son, vidéo, code) à partir d'une instruction en langage naturel, par opposition aux IA traditionnelles qui se limitaient à classer, prédire ou détecter.
- InférenceL'inférence est la phase d'utilisation d'un modèle d'IA, durant laquelle le modèle calcule une réponse à partir d'un prompt donné. C'est l'opération facturée par les fournisseurs d'API, distincte de l'entraînement qui est un coût fixe initial.
- LLM (Large Language Model)Un LLM (Large Language Model) est un type d'intelligence artificielle entraîné sur des corpus de texte de plusieurs centaines de milliards de mots, qui produit du langage naturel en prédisant, mot par mot, la suite la plus probable d'un texte donné.
- Modèle de fondationUn modèle de fondation est un modèle d'IA généraliste entraîné sur des données massives et diversifiées, qui sert de base réutilisable pour des dizaines voire des centaines d'applications métier différentes, par adaptation (fine-tuning, RAG, prompt) plutôt que par entraînement spécifique.
- MultimodalUn modèle d'IA multimodal est un modèle capable de traiter et de produire plusieurs types de contenu simultanément : texte, image, audio, vidéo, code. Le même modèle peut analyser une photo, comprendre une question vocale, lire un document, et répondre par écrit, sans pipeline intermédiaire.
- ParamètreUn paramètre d'un modèle d'IA est une valeur numérique apprise pendant l'entraînement, qui détermine la force des connexions entre neurones artificiels du réseau. Le nombre de paramètres mesure la capacité du modèle à stocker des associations entre les éléments de son corpus d'apprentissage.
- TokenUn token est l'unité élémentaire de texte qu'un modèle d'IA manipule, généralement un fragment de mot équivalent à 3 ou 4 caractères en français. Il est à la fois l'unité de calcul du modèle et l'unité de facturation des fournisseurs d'IA, comptabilisée séparément en entrée et en sortie.
- TransformerLe transformer est l'architecture de réseau de neurones, introduite par Google en 2017, qui sous-tend la quasi-totalité des modèles d'IA générative actuels. Son innovation centrale est le mécanisme d'attention, qui permet au modèle de pondérer dynamiquement l'importance relative des mots dans une séquence.