Preparación del entorno para crear un RAG (paso a paso)
Antes de empezar a construir un sistema RAG, es imprescindible preparar correctamente el entorno de trabajo. En este caso, partimos de:
- Windows 11
- Visual Studio Code
- Un proyecto nuevo llamado hello-world-rag
A continuación se documentan todos los pasos realizados, explicando qué hace cada comando y por qué es necesario.
1. Abrir el proyecto en Visual Studio Code
En Visual Studio Code, cada proyecto se corresponde con una carpeta. Para trabajar únicamente en el proyecto de RAG:
- Menú File → Open Folder
- Seleccionar la carpeta
hello-world-rag
A partir de ese momento, Visual Studio Code:
- Considera esa carpeta como el proyecto activo
- Abre la terminal directamente en esa ruta
- Ejecuta los comandos siempre en el contexto correcto
2. Abrir la terminal integrada
Para ejecutar comandos se utiliza la terminal integrada de Visual Studio Code:
- Menú Terminal → New Terminal
En Windows, esta terminal suele ser PowerShell, lo cual es perfectamente válido para trabajar con Python.
3. Comprobar las versiones de Python instaladas
En Windows pueden coexistir varias versiones de Python. Para verlas se utiliza el launcher oficial:
py -0
Este comando muestra todas las versiones disponibles y cuál es la predeterminada. En este caso, aparecían:
- Python 3.14 (demasiado nuevo para algunas librerías)
- Python 3.13 (versión estable y compatible)
Para evitar problemas al instalar dependencias, se decidió usar Python 3.13.
4. Crear un entorno virtual con una versión concreta de Python
Un entorno virtual permite aislar las librerías de cada proyecto. Así se evita:
- Conflictos entre proyectos
- Instalar paquetes “globales” innecesarios
- Problemas de versiones
Para crear el entorno virtual usando Python 3.13:
py -3.13 -m venv venv
Este comando significa:
py -3.13: usar explícitamente Python 3.13-m venv: ejecutar el módulo de entornos virtualesvenv: nombre de la carpeta donde se crea el entorno
Al finalizar, aparece una carpeta venv dentro del proyecto.
5. Activar el entorno virtual
Una vez creado, es necesario activar el entorno virtual:
.\venv\Scripts\Activate.ps1
Cuando el entorno está activo, la terminal muestra:
(venv)
Esto indica que:
- Python apunta al entorno virtual
- Las librerías se instalarán solo para este proyecto
6. Actualizar el gestor de paquetes (pip)
pip es el gestor de paquetes de Python, equivalente a Composer en PHP.
Conviene actualizarlo antes de instalar librerías:
python -m pip install --upgrade pip
Este comando:
- Usa el Python del entorno virtual
- Actualiza
pipa la última versión compatible
7. Instalar las dependencias del proyecto RAG
Para el primer ejemplo de RAG se instalaron dos librerías:
python -m pip install openai chromadb
Estas librerías sirven para:
- openai: comunicarse con un modelo de lenguaje (LLM) para generar respuestas.
- chromadb: crear una base de datos vectorial local donde almacenar y buscar fragmentos de texto por similitud semántica.
Instalarlas dentro del entorno virtual garantiza que:
- No afectan a otros proyectos
- Se pueden cambiar versiones sin riesgo
8. Verificar que las librerías están correctamente instaladas
Antes de continuar, es importante comprobar que Python puede importar las librerías:
python -c "import openai, chromadb; print('OK')"
Si el resultado es:
OK
significa que el entorno está correctamente preparado.
Qué hemos conseguido hasta aquí
- Un proyecto aislado llamado
hello-world-rag - Un entorno virtual controlado
- Una versión de Python compatible
- Las librerías necesarias para construir un RAG
Aunque al principio se ejecutan muchos comandos, cada uno tiene un objetivo claro. Este paso es fundamental para evitar problemas más adelante y poder centrarse en la lógica del sistema RAG.
En el siguiente apartado se empezará con el ejemplo práctico: cargar documentos, indexarlos y hacer la primera consulta RAG.
