Dernière revue :

Qu'est-ce qu'une fenêtre de contexte ? Définition et enjeux pour l'entreprise

La fenêtre de contexte est la quantité maximale de texte qu'un modèle d'IA peut traiter en une seule requête, mesurée en tokens. Elle inclut le prompt envoyé et la réponse à produire. Au-delà de cette limite, le modèle perd l'accès aux informations les plus anciennes de l'échange.

La fenêtre de contexte est une caractéristique technique du modèle, fixée à sa construction. Pour GPT-3 en 2020, elle était de 4 096 tokens, soit environ 3 000 mots ou 6 pages. En 2026, les modèles de frontière dépassent le million de tokens : Claude Opus 4.6, Claude Sonnet 4.6, GPT-5.4 et Gemini 3.1 Pro disposent tous d'un million de tokens (environ 750 000 mots, soit 1 500 pages), avec Llama 4 Scout annonçant 10 millions. Cette expansion change radicalement les cas d'usage possibles. Vous pouvez injecter un dossier complet, une base de connaissances entière, un historique de conversation de plusieurs mois. Mais attention : taille déclarée et qualité effective divergent. La recherche en context decay (notamment chez Chroma et Anthropic) montre que la précision du modèle baisse sur les informations placées au milieu de très longs contextes. Pour des cas critiques, mieux vaut un contexte resserré et bien structuré qu'un dossier de 800 000 tokens placé en vrac.

Exemple concret

En décembre 2022, GPT-3.5 acceptait 4 096 tokens en entrée, soit environ 3 000 mots. En mars 2026, Anthropic a généralisé Claude Sonnet 4.6 avec une fenêtre de un million de tokens, au tarif standard (3 dollars par million de tokens en entrée, 15 en sortie). En trois ans, la capacité d'ingestion d'un seul appel a été multipliée par 244. Concrètement, un cabinet d'avocats peut soumettre l'intégralité d'un dossier client (contrats, échanges, jurisprudence) dans un seul prompt, là où il aurait fallu auparavant orchestrer un RAG avec base vectorielle. La simplification d'architecture est radicale, le coût aussi maîtrisé.

À voir aussi

Sources

  1. Claude's 1M context window now generally available, Anthropic, mars 2026. https://www.anthropic.com/news (consulté le 2026-05-24)
  2. What is a context window?, IBM Think 2026. https://www.ibm.com/think/topics/context-window (consulté le 2026-05-24)

← Retour au glossaire

Adresse copiée