Última revisión:

¿Qué es el fine-tuning? Definición y retos para la empresa

El fine-tuning es una técnica de adaptación de un modelo de IA ya entrenado, que consiste en proseguir su entrenamiento sobre un conjunto de datos específico a su caso de uso. Modifica los parámetros internos del modelo, a diferencia del RAG, que se limita a inyectar contexto en el momento de la consulta.

Tres familias de fine-tuning conviven en 2026. El fine-tuning completo (full fine-tuning): se reajusta el conjunto de parámetros del modelo, lo que exige una potencia de cálculo elevada y un volumen de datos consecuente (típicamente 1 000 a 100 000 ejemplos). El fine-tuning paramétricamente eficiente (PEFT): solo se ajusta una pequeña fracción de los parámetros, a menudo menos del 1 % mediante la técnica LoRA (Low-Rank Adaptation, Hu et al., 2021). Este enfoque divide el coste de cálculo por 100 a 1 000, sin degradación significativa de la calidad en la mayoría de los casos. El instruction tuning: variante que consiste en enseñar al modelo a seguir consignas estructuradas más que a adaptar un dominio de negocio. El fine-tuning es potente pero costoso de mantener: cada actualización de la base de conocimientos exige un reentrenamiento. Para casos donde los datos cambian con frecuencia, el RAG es generalmente preferible.

Ejemplo concreto

Un despacho de auditoría financiera de 200 colaboradores busca automatizar la redacción de notas de análisis a partir de conjuntos de datos contables. Tres opciones cifradas. Fine-tuning completo de un Llama 3 70B sobre 5 000 notas históricas: coste de entrenamiento unos 15 000 euros, calidad óptima pero tiempo de puesta a punto de 6 semanas. Fine-tuning LoRA sobre el mismo modelo: coste 800 euros, calidad del 90 % al 95 % del fine-tuning completo, tiempo 4 días. RAG sobre las 5 000 notas sin fine-tuning: coste de indexación 50 euros, calidad del 75 % al 85 %, tiempo 1 día, pero reindexación automática en cada nueva nota. La elección depende del criterio prioritario: calidad, coste, frescura.

Ver también

Para profundizar

LoRA: Low-Rank Adaptation of Large Language Models, Hu et al., 2021 (recurso externo)

Fuentes

  1. LoRA: Low-Rank Adaptation of Large Language Models, Hu et al., arXiv:2106.09685, 2021. https://arxiv.org/abs/2106.09685 (consultado el 2026-05-24)
  2. Language Models are Few-Shot Learners, Brown et al., NeurIPS 2020. https://arxiv.org/abs/2005.14165 (consultado el 2026-05-24)

← Volver al glosario

Dirección copiada