Arquitecturas avanzadas
Las técnicas que distinguen un despliegue amateur de uno industrial: RAG, fine-tuning, destilación, MoE, MCP, API. El léxico de los arbitrajes técnicos para directivos.
- API de IAUna API de IA es una interfaz técnica que permite a una aplicación informática enviar consultas a un modelo de IA alojado por un proveedor, y recuperar sus respuestas. Es el modo de acceso estándar a la IA en empresa, frente al alojamiento local del modelo.
- Base vectorialUna base vectorial es una base de datos especializada en el almacenamiento y la búsqueda de vectores (embeddings). Permite recuperar, para una consulta dada, los contenidos semánticamente más próximos en un corpus, sin correspondencia léxica exacta. Es el motor de búsqueda típico de un sistema RAG.
- DestilaciónLa destilación es una técnica que consiste en transferir el conocimiento de un gran modelo de IA (modelo profesor) a un modelo más pequeño (modelo estudiante), preservando lo esencial del rendimiento. Permite desplegar modelos ligeros con coste de inferencia reducido, viables sobre infraestructuras más modestas.
- Fine-tuningEl fine-tuning es una técnica de adaptación de un modelo de IA ya entrenado, que consiste en proseguir su entrenamiento sobre un conjunto de datos específico a su caso de uso. Modifica los parámetros internos del modelo, a diferencia del RAG, que se limita a inyectar contexto en el momento de la consulta.
- Function callingEl function calling es la capacidad de un modelo de IA de invocar funciones o herramientas predefinidas para ejecutar acciones en un sistema externo. El modelo devuelve un objeto estructurado (JSON) en lugar de texto, permitiendo a la aplicación llamar a la función y reinyectar el resultado en la conversación.
- MCP (Model Context Protocol)El MCP (Model Context Protocol) es un estándar abierto, introducido por Anthropic en noviembre de 2024, que permite a un modelo de IA conectarse a fuentes de datos y herramientas externas de manera uniforme. Evita la escritura de conectores específicos para cada combinación modelo-aplicación.
- Modelo de código abiertoUn modelo IA de código abierto es un modelo de fundación cuyos pesos y arquitectura son libremente descargables y explotables bajo licencia permisiva (Apache 2.0, MIT). Se opone al modelo propietario (Claude, GPT, Gemini) accesible únicamente vía API. La elección compromete soberanía, coste y flexibilidad a largo plazo.
- MoE (Mixture of Experts)Mixture of Experts (MoE) es una arquitectura de modelo de IA que divide la red en submodelos especializados, llamados expertos. Para cada token tratado, un enrutador selecciona dinámicamente algunos expertos, dejando inactivos a los demás. El modelo tiene la capacidad de un gran modelo pero el coste de cálculo de uno más pequeño.
- RAG (Retrieval-Augmented Generation)El RAG (Retrieval-Augmented Generation) es una arquitectura de IA que acopla un motor de búsqueda en sus documentos a un modelo generativo: el modelo responde apoyándose en sus datos de negocio citables, y no únicamente en sus conocimientos de entrenamiento.