Última revisión:
¿Qué es una base vectorial? Definición y retos para la empresa
Una base vectorial es una base de datos especializada en el almacenamiento y la búsqueda de vectores (embeddings). Permite recuperar, para una consulta dada, los contenidos semánticamente más próximos en un corpus, sin correspondencia léxica exacta. Es el motor de búsqueda típico de un sistema RAG.
Una base vectorial almacena embeddings, es decir, representaciones numéricas (típicamente de 768 a 3 072 dimensiones) del sentido de los documentos indexados. Cuando llega una consulta, se convierte en embedding, y la base busca los vectores más próximos según una medida de similitud (coseno, producto escalar). Para escalar, estas bases utilizan algoritmos de aproximación (ANN, approximate nearest neighbors) como HNSW o IVF, que sacrifican una precisión marginal a cambio de tiempos de respuesta en milisegundos sobre miles de millones de vectores. El mercado en 2026 comprende tres categorías. Los actores especializados puros: Pinecone, Weaviate, Qdrant, Milvus. Las extensiones de bases relacionales: pgvector para PostgreSQL, Azure SQL con extensiones. Las bases multimodelo: MongoDB, Elasticsearch, Redis, que han integrado la búsqueda vectorial. La elección depende de la madurez del equipo, del volumen, y de la necesidad de combinar búsqueda vectorial y búsqueda estructurada clásica.
Ejemplo concreto
Un despacho de abogados de 150 colaboradores indexa 80 000 actos jurídicos antiguos para permitir a sus socios consultar su propia jurisprudencia interna. Tres opciones técnicas comparadas. Pinecone (cloud propietario): 380 euros al mes para este volumen, puesta en marcha en 2 días, alojamiento US. Qdrant Cloud Europe: 220 euros al mes, puesta en marcha en 3 días, alojamiento Fráncfort, conforme al RGPD. pgvector sobre PostgreSQL interno: coste casi nulo si el SGBD ya existe, puesta en marcha en 7 a 10 días, control total. El despacho ha elegido pgvector por la soberanía y el coste, a pesar de la puesta en marcha más larga.
Ver también
Para profundizar
Efficient and robust approximate nearest neighbor search using HNSW, Malkov & Yashunin, 2016
Fuentes
- Efficient and robust approximate nearest neighbor search using HNSW graphs, Malkov & Yashunin, arXiv:1603.09320, 2016. https://arxiv.org/abs/1603.09320
- Vector database comparison, Pinecone documentation, 2026. https://www.pinecone.io/learn/vector-database/