Cómo se entrena un LLM. Parte 1: el pretraining y por qué no basta
Por qué un LLM recién entrenado no se comporta como ChatGPT. Qué es el pretraining, qué sabe el modelo después y por qué necesita alineamiento.
Por qué un LLM recién entrenado no se comporta como ChatGPT. Qué es el pretraining, qué sabe el modelo después y por qué necesita alineamiento.