Los modelos de lenguaje de gran tamaño (LLM, large language models, por sus siglas en inglés) son sistemas de inteligencia artificial entrenados para comprender y generar texto de manera similar a cómo escribimos o hablamos los humanos. Son el motor detrás de herramientas como ChatGPT, Google Bard o Claude.
Modelos de lenguaje de gran tamaño: texto, contexto y potencia
Lo de “gran tamaño” va en serio: estos modelos se entrenan con enormes cantidades de texto (libros, sitios web, conversaciones) y manejan miles de millones (o billones) de parámetros, que son como perillas de memoria que les permiten detectar patrones, estilo, tono y hasta un poco de lógica.
No piensan como una persona: simplemente predicen qué palabra viene después, basándose en lo que han visto antes. Aun así, pueden hacer cosas muy útiles: escribir ensayos, resumir noticias, responder preguntas, traducir idiomas y hasta programar.
Usan arquitecturas como los transformers, que les permiten entender mejor el contexto. Pero también traen desafíos: sesgos, errores creativos (como inventar datos) y dilemas éticos sobre su uso.