Última revisión:

¿Qué es el coste por token IA? Definición y retos para la empresa

El coste por token es la unidad económica elemental de un despliegue de IA. Los proveedores facturan por separado los tokens de entrada (su prompt) y de salida (la respuesta del modelo), con una ratio típica de 1 a 5. Dominar este coste exige distinguir tarifas unitarias, volúmenes, y palancas de optimización.

El coste por token se expresa en dólares por millón de tokens (MTok). Las tarifas Anthropic en mayo de 2026 ilustran los órdenes de magnitud. Claude Haiku 4.5 (modelo ligero): 1 $ entrada, 5 $ salida por MTok. Claude Sonnet 4.6 (equilibrio calidad/coste): 3 $ / 15 $. Claude Opus 4.7 (modelo puntero): 5 $ / 25 $. La ratio output/input es constante en 5:1 en la gama Anthropic. Los competidores practican tarifas comparables: GPT-5.4 de OpenAI en torno a 2,50 $/MTok, DeepSeek V3.2 en 0,14 $/MTok. Tres palancas de optimización existen. El batch API: menos 50 % en entrada y salida, para los usos no interactivos. El prompt caching: hasta menos 90 % en los inputs en caché (contextos repetidos, system prompts). La elección de modelo adaptado: un Haiku 4.5 cuesta cinco veces menos que un Opus 4.7 para casos de uso de clasificación, extracción, o enrutamiento.

Ejemplo concreto

Una pyme de 90 empleados utiliza un asistente IA vía API Claude Sonnet 4.6 para 3 000 consultas al día. Un intercambio tipo consume 800 tokens de entrada y 400 de salida. Cálculo mensual: 3 000 × 22 días × 800 entrada × (3 $/MTok) = 158 $ de entrada. 3 000 × 22 × 400 × (15 $/MTok) = 396 $ de salida. Total bruto: 554 $ al mes, alrededor de 6 600 $ al año. Activación del prompt caching sobre los 600 tokens de contexto común: menos 50 % sobre la entrada, ahorro anual de 950 $. Cambio de modelo a Haiku 4.5 para el 40 % de consultas simples (clasificación de solicitudes): 1 800 $ de ahorro adicional anual.

Ver también

Para profundizar

Anthropic API pricing page, tarifas actualizadas en mayo de 2026 (recurso externo)

Fuentes

  1. Anthropic API pricing page, tarifas Claude Haiku 4.5, Sonnet 4.6, Opus 4.7, mayo de 2026. https://www.anthropic.com/pricing (consultado el 2026-05-24)
  2. OpenAI API pricing page, GPT-5.4 y modelos ligeros, 2026. https://openai.com/api/pricing/ (consultado el 2026-05-24)

← Volver al glosario

Dirección copiada