Dernière revue :

Qu'est-ce que le coût par token IA ? Définition et enjeux pour l'entreprise

Le coût par token est l'unité économique élémentaire d'un déploiement IA. Les fournisseurs facturent séparément les tokens en entrée (votre prompt) et en sortie (la réponse du modèle), avec un ratio typique de 1 pour 5. Maîtriser ce coût exige de distinguer tarifs unitaires, volumes, et leviers d'optimisation.

Le coût par token est exprimé en dollars par million de tokens (MTok). Les tarifs Anthropic en mai 2026 illustrent les ordres de grandeur. Claude Haiku 4.5 (modèle léger) : 1 $ en entrée, 5 $ en sortie par MTok. Claude Sonnet 4.6 (équilibre qualité/coût) : 3 $ / 15 $. Claude Opus 4.7 (modèle de pointe) : 5 $ / 25 $. Le ratio output/input est constant à 5:1 sur la gamme Anthropic. Les concurrents pratiquent des grilles comparables : GPT-5.4 d'OpenAI à environ 2,50 $/MTok, DeepSeek V3.2 à 0,14 $/MTok. Trois leviers d'optimisation existent. Le batch API : moins 50 % sur entrée et sortie, pour les usages non interactifs. Le prompt caching : jusqu'à moins 90 % sur les inputs cachés (contextes répétés, system prompts). Le choix de modèle adapté : un Haiku 4.5 coûte cinq fois moins qu'un Opus 4.7 pour des cas d'usage classification, extraction, ou routage.

Exemple concret

Une PME de 90 salariés utilise un assistant IA via API Claude Sonnet 4.6 pour 3 000 requêtes par jour. Un échange type consomme 800 tokens en entrée et 400 en sortie. Calcul mensuel : 3 000 × 22 jours × 800 entrée × (3 $/MTok) = 158 $ pour l'entrée. 3 000 × 22 × 400 × (15 $/MTok) = 396 $ pour la sortie. Total brut : 554 $ par mois, soit environ 6 600 $ par an. Activation du prompt caching sur les 600 tokens de contexte commun : moins 50 % sur l'entrée, économie annuelle de 950 $. Bascule du modèle vers Haiku 4.5 pour 40 % des requêtes simples (classification de demandes) : 1 800 $ d'économie supplémentaire annuelle.

À voir aussi

Pour aller plus loin

Anthropic API pricing page, tarifs mis à jour mai 2026 (ressource externe)

Sources

  1. Anthropic API pricing page, tarifs Claude Haiku 4.5, Sonnet 4.6, Opus 4.7, mai 2026. https://www.anthropic.com/pricing (consulté le 2026-05-24)
  2. OpenAI API pricing page, GPT-5.4 et modèles légers, 2026. https://openai.com/api/pricing/ (consulté le 2026-05-24)

← Retour au glossaire

Adresse copiée