RAG - Retrieval Augmented Generation
Generación Aumentada por Recuperación
Construir un primer sistema RAG sencillo
Después de entender qué es RAG y de preparar correctamente las fuentes, llega el momento de dar el siguiente paso: ver cómo se construye un RAG mínimo y funcional.
En esta fase no buscamos un sistema perfecto ni definitivo. Buscamos algo mucho más importante:
Entender el flujo completo de principio a fin.
Objetivo de esta fase
El objetivo no es dominar herramientas concretas, sino interiorizar una arquitectura base que luego podrás:
- Mejorar
- Escalar
- Integrar en un software o ERP
Un RAG sencillo debe permitir:
- Cargar documentación
- Buscar información relevante
- Generar respuestas basadas en esa información
La arquitectura mínima de un RAG
Un primer RAG funcional puede resumirse en cuatro piezas muy claras.
Documentos ↓ Fragmentación (chunks) ↓ Búsqueda semántica ↓ Respuesta generada por IA
Vamos a ver cada una de ellas sin entrar todavía en detalles técnicos complejos.
1. Cargar la documentación
Todo empieza con las fuentes de conocimiento:
- Textos en HTML o Markdown
- Manuales internos
- FAQs
- Documentación funcional
En esta fase inicial, lo importante no es el formato exacto, sino que el contenido esté:
- Bien escrito
- Bien estructurado
- Actualizado
Un error común es empezar con demasiados documentos.
Empieza con poca documentación, pero de calidad.
2. Fragmentar el contenido
Una vez cargados los documentos, el siguiente paso es dividirlos en fragmentos.
Cada fragmento debería:
- Tratar un único tema
- Tener sentido por sí mismo
- Responder potencialmente a una pregunta
En un primer RAG no es necesario obsesionarse con el tamaño exacto, pero sí evitar:
- Fragmentos demasiado pequeños
- Fragmentos excesivamente largos
La fragmentación es lo que permite que el sistema encuentre el texto adecuado en lugar de uno genérico.
3. Preparar la búsqueda semántica
Aquí ocurre el cambio más importante respecto a una búsqueda tradicional.
En lugar de buscar palabras exactas, el sistema busca significado.
De forma simplificada:
- Cada fragmento se transforma en una representación numérica
- La pregunta del usuario también
- Se comparan ambas para ver cuáles son más similares
El resultado no es un único texto, sino varios fragmentos ordenados por relevancia.
La calidad de esta búsqueda depende directamente de cómo esté escrita y fragmentada la documentación.
4. Generar la respuesta
Una vez seleccionados los fragmentos relevantes, estos se envían al modelo de lenguaje junto con la pregunta del usuario.
El modelo:
- No responde “de memoria”
- No inventa información nueva
- Redacta basándose en los textos recibidos
En un RAG bien diseñado, el modelo recibe una instrucción clara:
Responde únicamente con la información proporcionada. Si no hay información suficiente, indícalo.
Esto reduce de forma muy significativa las respuestas incorrectas o inventadas.
Qué NO hace todavía este primer RAG
Es importante tener claro que este primer sistema:
- No gestiona permisos por usuario
- No cruza datos en tiempo real
- No tiene contexto de negocio avanzado
Y no pasa nada.
Este RAG es una base sobre la que construir, no el producto final.
Por qué este primer RAG ya es valioso
Aunque sea sencillo, este sistema:
- Convierte la documentación en algo consultable
- Reduce la dependencia del conocimiento tribal
- Sirve como base para asistentes más avanzados
Además, permite detectar rápidamente:
- Qué documentación falta
- Qué textos generan confusión
- Qué preguntas hacen realmente los usuarios
- Un RAG sencillo tiene pocas piezas, pero bien definidas
- El flujo siempre es: documentos → búsqueda → respuesta
- No hace falta empezar con algo complejo
- La comprensión del flujo es más importante que la tecnología usada
En la siguiente entrada entraremos en más detalle técnico: qué herramientas suelen usarse y cómo se conectan entre sí.
