Dernière revue :

Qu'est-ce qu'un token IA ? Définition et enjeux pour l'entreprise

Un token est l'unité élémentaire de texte qu'un modèle d'IA manipule, généralement un fragment de mot équivalent à 3 ou 4 caractères en français. Il est à la fois l'unité de calcul du modèle et l'unité de facturation des fournisseurs d'IA, comptabilisée séparément en entrée et en sortie.

Pour découper un texte en tokens, les modèles utilisent un algorithme (généralement Byte Pair Encoding, BPE) qui attribue un token unique aux séquences de caractères les plus fréquentes de leur corpus d'entraînement. Conséquence : un mot courant comme « bonjour » compte pour 1 seul token, tandis qu'un terme rare comme « désintermédiation » sera découpé en plusieurs morceaux. Côté fonctionnement, chaque token généré exige un passage complet à travers le réseau de neurones du modèle, soit des milliards d'opérations mathématiques. D'où un double coût : énergétique (électricité consommée par les serveurs) et économique (facturé par les fournisseurs). Les tarifs Anthropic en mai 2026 illustrent les ordres de grandeur : Claude Haiku 4.5 à 1 $ en entrée et 5 $ en sortie par million de tokens, Sonnet 4.6 à 3 $/15 $, Opus 4.7 à 5 $/25 $. Le ratio output/input est constant à 5:1 sur la gamme.

Exemple concret

Une PME de 50 collaborateurs utilise un assistant IA via API Claude Sonnet 4.6 pour rédiger ses réponses commerciales. Un échange type consomme 500 tokens en entrée et 800 en sortie, soit environ 0,014 $ avec les tarifs mai 2026. Sur 1 000 échanges mensuels, la facture reste anecdotique (14 $). Mais doublez la longueur des prompts par manque de méthode, et elle passe à 28 $. À l'échelle d'une ETI avec 50 000 échanges mensuels, l'écart devient structurant : 700 $ contre 1 400 $, soit environ 8 400 $ de différence annuelle pour le même usage métier.

À voir aussi

Pour aller plus loin

Anthropic API pricing page, tarifs mis à jour mai 2026 (ressource externe)

Sources

  1. Anthropic API pricing page, tarifs Claude Haiku 4.5, Sonnet 4.6, Opus 4.7, mai 2026. https://www.anthropic.com/pricing (consulté le 2026-05-25)
  2. Neural Machine Translation of Rare Words with Subword Units, Sennrich, Haddow & Birch, ACL 2016 (algorithme BPE). https://arxiv.org/abs/1508.07909 (consulté le 2026-05-25)

← Retour au glossaire

Adresse copiée