Fundamentos
La base de vocabulario para hablar de IA en comité de dirección. Sin estas nociones compartidas, el resto del glosario se lee a medias.
- EmbeddingUn embedding es la representación numérica de una palabra, de una frase o de un documento, en forma de vector en un espacio de varios cientos o miles de dimensiones. Dos textos semánticamente próximos tienen embeddings geométricamente próximos, lo que permite la búsqueda por sentido y no por palabras clave.
- EntrenamientoEl entrenamiento es la fase de construcción de un modelo de IA, durante la cual el modelo ingiere un corpus masivo y ajusta sus miles de millones de parámetros internos para aprender las regularidades estadísticas de ese corpus. Es la operación más costosa del ciclo de vida de un modelo.
- IA generativaLa IA generativa es una familia de modelos de inteligencia artificial capaces de producir contenido nuevo (texto, imagen, sonido, vídeo, código) a partir de una instrucción en lenguaje natural, a diferencia de las IA tradicionales, que se limitaban a clasificar, predecir o detectar.
- InferenciaLa inferencia es la fase de uso de un modelo de IA, durante la cual el modelo calcula una respuesta a partir de un prompt dado. Es la operación facturada por los proveedores de API, distinta del entrenamiento, que es un coste fijo inicial.
- LLM (Large Language Model)Un LLM (Large Language Model) es un tipo de inteligencia artificial entrenado sobre corpus de texto de varios cientos de miles de millones de palabras, que produce lenguaje natural prediciendo, palabra por palabra, la continuación más probable de un texto dado.
- Modelo de fundaciónUn modelo de fundación es un modelo de IA generalista entrenado sobre datos masivos y diversificados, que sirve de base reutilizable para decenas o incluso cientos de aplicaciones de negocio distintas, por adaptación (fine-tuning, RAG, prompt) y no por entrenamiento específico.
- MultimodalUn modelo de IA multimodal es un modelo capaz de tratar y de producir varios tipos de contenido simultáneamente: texto, imagen, audio, vídeo, código. El mismo modelo puede analizar una foto, comprender una pregunta vocal, leer un documento, y responder por escrito, sin pipeline intermedio.
- ParámetroUn parámetro de un modelo de IA es un valor numérico aprendido durante el entrenamiento, que determina la fuerza de las conexiones entre las neuronas artificiales de la red. El número de parámetros mide la capacidad del modelo para almacenar asociaciones entre los elementos de su corpus de aprendizaje.
- TokenUn token es la unidad elemental de texto que manipula un modelo de IA, generalmente un fragmento de palabra equivalente a 3 o 4 caracteres en español. Es a la vez la unidad de cálculo del modelo y la unidad de facturación de los proveedores de IA, contabilizada por separado en entrada y en salida.
- TransformerEl transformer es la arquitectura de red neuronal, introducida por Google en 2017, que sustenta la casi totalidad de los modelos de IA generativa actuales. Su innovación central es el mecanismo de atención, que permite al modelo ponderar dinámicamente la importancia relativa de las palabras en una secuencia.