Blog de Aitanet (novedades sobre Inteligencia Artificial)

Por qué NVIDIA: el chip, el foso CUDA y la fiebre del compute
NVIDIA superó brevemente a Apple como empresa más valiosa del mundo gracias a la IA. Pero su monopolio no es de silicio: es de un ecosistema de software (CUDA) que llevan construyendo desde 2006. Por qué nadie le quita el sitio.

Cómo se entrena un LLM. Parte 5: las grietas de RLHF
RLHF funcionó, pero tiene grietas serias que motivaron todo lo que vino después. Reward hacking, cuello de botella humano, sesgos heredados, PPO frágil y KL como freno y no guardarraíl: las cinco limitaciones estructurales y la respuesta del campo a cada una.

El trabajo humano invisible detrás de los LLMs. Parte 2: la paradoja del modelo amable
Cuando tu chatbot rechaza educadamente generar contenido tóxico, esa amabilidad es el reverso de la exposición sin filtro de quien lo entrenó. La paradoja moral, los sesgos culturales que se cuelan y hacia dónde apunta la industria.

El trabajo humano invisible detrás de los LLMs. Parte 1: quién, dónde, cómo
Detrás de cada ChatGPT, Claude o Gemini hay miles de personas en Nairobi, Manila o Calcuta haciendo clic 8 horas al día. Quiénes son, qué hacen y a qué precio.

Cómo se entrena un LLM. Parte 4: RLHF, la maquinaria
La técnica que convirtió GPT-3 en ChatGPT: cómo se afina un modelo a base de comparaciones humanas. Reward model, PPO y por qué noviembre de 2022 cambió todo.

Wavespeed: el supermercado de modelos generativos
Wavespeed agrega cientos de modelos de IA generativa tras una sola API. Pros, contras, precios y cuándo conviene frente a alternativas como fal.ai o Replicate.

Cómo se entrena un LLM. Parte 3: por dentro del bucle
Qué hay físicamente en los ficheros de entrenamiento de un LLM, dónde queda lo que el modelo aprende y por qué actualizarlo con información nueva no es algo que ocurra solo.
MediaPipe y hand tracking: detectar manos en tiempo real con una webcam, gratis
Qué es MediaPipe y cómo permite detectar manos y sus 21 puntos clave en tiempo real con una simple webcam, gratis y sin hardware especial.

Cómo se entrena un LLM. Parte 2: cómo se le dice al modelo «esto está bien»
Qué pasa físicamente dentro de un LLM cuando se le ‘premia’ o ‘penaliza’. La analogía de la orquesta, la función de pérdida y por qué el alineamiento no es trivial.
