Curso sobre RAG: 5 – Construir un primer sistema RAG sencillo

RAG - Retrieval Augmented Generation
Generación Aumentada por Recuperación

Construir un primer sistema RAG sencillo

Después de entender qué es RAG y de preparar correctamente las fuentes, llega el momento de dar el siguiente paso: ver cómo se construye un RAG mínimo y funcional.

En esta fase no buscamos un sistema perfecto ni definitivo. Buscamos algo mucho más importante:

Entender el flujo completo de principio a fin.


Objetivo de esta fase

El objetivo no es dominar herramientas concretas, sino interiorizar una arquitectura base que luego podrás:

  • Mejorar
  • Escalar
  • Integrar en un software o ERP

Un RAG sencillo debe permitir:

  • Cargar documentación
  • Buscar información relevante
  • Generar respuestas basadas en esa información

La arquitectura mínima de un RAG

Un primer RAG funcional puede resumirse en cuatro piezas muy claras.

Documentos
   ↓
Fragmentación (chunks)
   ↓
Búsqueda semántica
   ↓
Respuesta generada por IA

Vamos a ver cada una de ellas sin entrar todavía en detalles técnicos complejos.


1. Cargar la documentación

Todo empieza con las fuentes de conocimiento:

  • Textos en HTML o Markdown
  • Manuales internos
  • FAQs
  • Documentación funcional

En esta fase inicial, lo importante no es el formato exacto, sino que el contenido esté:

  • Bien escrito
  • Bien estructurado
  • Actualizado

Un error común es empezar con demasiados documentos.

Consejo práctico:
Empieza con poca documentación, pero de calidad.

2. Fragmentar el contenido

Una vez cargados los documentos, el siguiente paso es dividirlos en fragmentos.

Cada fragmento debería:

  • Tratar un único tema
  • Tener sentido por sí mismo
  • Responder potencialmente a una pregunta

En un primer RAG no es necesario obsesionarse con el tamaño exacto, pero sí evitar:

  • Fragmentos demasiado pequeños
  • Fragmentos excesivamente largos

La fragmentación es lo que permite que el sistema encuentre el texto adecuado en lugar de uno genérico.


3. Preparar la búsqueda semántica

Aquí ocurre el cambio más importante respecto a una búsqueda tradicional.

En lugar de buscar palabras exactas, el sistema busca significado.

De forma simplificada:

  • Cada fragmento se transforma en una representación numérica
  • La pregunta del usuario también
  • Se comparan ambas para ver cuáles son más similares

El resultado no es un único texto, sino varios fragmentos ordenados por relevancia.

Idea clave:
La calidad de esta búsqueda depende directamente de cómo esté escrita y fragmentada la documentación.

4. Generar la respuesta

Una vez seleccionados los fragmentos relevantes, estos se envían al modelo de lenguaje junto con la pregunta del usuario.

El modelo:

  • No responde “de memoria”
  • No inventa información nueva
  • Redacta basándose en los textos recibidos

En un RAG bien diseñado, el modelo recibe una instrucción clara:

Responde únicamente con la información proporcionada. Si no hay información suficiente, indícalo.

Esto reduce de forma muy significativa las respuestas incorrectas o inventadas.


Qué NO hace todavía este primer RAG

Es importante tener claro que este primer sistema:

  • No gestiona permisos por usuario
  • No cruza datos en tiempo real
  • No tiene contexto de negocio avanzado

Y no pasa nada.

Este RAG es una base sobre la que construir, no el producto final.


Por qué este primer RAG ya es valioso

Aunque sea sencillo, este sistema:

  • Convierte la documentación en algo consultable
  • Reduce la dependencia del conocimiento tribal
  • Sirve como base para asistentes más avanzados

Además, permite detectar rápidamente:

  • Qué documentación falta
  • Qué textos generan confusión
  • Qué preguntas hacen realmente los usuarios
Recapitulación final:
  • Un RAG sencillo tiene pocas piezas, pero bien definidas
  • El flujo siempre es: documentos → búsqueda → respuesta
  • No hace falta empezar con algo complejo
  • La comprensión del flujo es más importante que la tecnología usada

En la siguiente entrada entraremos en más detalle técnico: qué herramientas suelen usarse y cómo se conectan entre sí.

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Scroll al inicio