Última revisión:
¿Qué es el entrenamiento de un modelo de IA? Definición y retos
El entrenamiento es la fase de construcción de un modelo de IA, durante la cual el modelo ingiere un corpus masivo y ajusta sus miles de millones de parámetros internos para aprender las regularidades estadísticas de ese corpus. Es la operación más costosa del ciclo de vida de un modelo.
El entrenamiento de un modelo de IA se descompone en dos fases distintas. El preentrenamiento (pre-training) consiste en exponer el modelo a un corpus muy voluminoso y generalista (Wikipedia, libros digitalizados, código fuente, archivos web) para que aprenda las estructuras estadísticas del lenguaje. Esta fase dura semanas o meses sobre clústeres de miles de GPU. Al final, el modelo predice correctamente la continuación de un texto sin conocer su caso de uso de negocio. El postentrenamiento (post-training) cubre las etapas de alineación y adaptación: aprendizaje supervisado sobre ejemplos anotados, aprendizaje por refuerzo con retroalimentación humana (RLHF), y fine-tuning sobre datos específicos. Estas etapas orientan el comportamiento del modelo hacia lo esperado de un asistente útil (seguridad, tono, formato). El entrenamiento es una operación de coste fijo elevado. Una vez realizado, el modelo queda congelado: para modificar sus conocimientos, hay que entrenarlo de nuevo (costoso) o proporcionarle el contexto en cada consulta vía un RAG (económico).
Ejemplo concreto
Según el informe Stanford AI Index 2025, el coste del entrenamiento de los modelos de frontera ha explotado: 670 dólares para el transformer original de 2017, 4,6 millones de dólares para GPT-3 en 2020, 78 millones de dólares para GPT-4 en 2023, y 192 millones de dólares para Google Gemini Ultra 1.0 en 2024. Llama 3.1 405B de Meta costó unos 170 millones de dólares. Esta inflación, estimada en 2,4 veces al año desde 2016, sitúa el entrenamiento de los modelos punteros fuera del alcance de cualquier entidad fuera de las GAFAM, fuera de Anthropic, fuera de los pocos laboratorios competidores financiados en miles de millones de dólares. Para una mediana empresa, la cuestión no es entrenar, sino elegir el modelo preentrenado adecuado.
Ver también
Fuentes
- Artificial Intelligence Index Report 2025, Stanford HAI, capítulo 1. https://hai.stanford.edu/ai-index/2025-ai-index-report
- The Rising Costs of Training Frontier AI Models, Cottier et al., arXiv:2405.21015, 2024. https://arxiv.org/abs/2405.21015