Hombre de pie frente a un portátil cerrado en el suelo, con los brazos en jarra, mirándolo sin saber por dónde empezar. Metáfora visual de un modelo pre-entrenado: todo el potencial delante, sin instrucciones de uso.
IA, LLMs

Cómo se entrena un LLM. Parte 1: el pretraining y por qué no basta

Por qué un LLM recién entrenado no se comporta como ChatGPT. Qué es el pretraining, qué sabe el modelo después y por qué necesita alineamiento.