Un robot de letras
La aplicación razonable de la inteligencia artificial a las humanidades abre un nuevo mundo para la ciencia
Mis muchos amigos de letras estarán encantados de conocer a Aeneas (Eneas), una inteligencia artificial que no solo deduce la fuente de cualquier original latino que le muestres y calcula su edad, sino que también rellena las partes del texto que se han perdido. Aeneas hace todo esto con la misma metodología que los historiadores, que consiste en comparar la inscripción en cuestión con otras inscripciones antiguas que utilicen frases similares, en un proceso largo y fatigoso solo apto para ratones de biblioteca. La máquina lo hace deprisa, sin cansarse y al menos tan bien como los eruditos. Como es costumbre en estos casos, los creadores de Aeneas aseguran que el sistema funciona mejor en colaboración con los humanos.
Eneas, hijo de Afrodita y Anquises, fue un héroe de la guerra de Troya que logró escapar tras la caída de la ciudad, según la mitología grecorromana. Homero sugirió en la Ilíada que el tipo llevaba francamente mal que Héctor le superara en valor y prestigio, y eso le colgó después el sambenito de que había traicionado a los troyanos. En cualquier caso, parece ser que Eneas llegó en su huida nada menos que hasta el Lacio, donde sus descendientes Rómulo y Remo fundaron Roma. Virgilio le describe en la Eneida como “pelirrojo, bien proporcionado, elocuente, afable, fuerte, inteligente, piadoso, agraciado y de alegres ojos negros”. Ni el guionista de Bruce Willis se habría atrevido a tanto.
Los creadores de Aeneas son ya un clásico de la inteligencia artificial (IA). Son los mismos investigadores de varias universidades griegas y británicas y de la ya mitológica DeepMind, la compañía londinense adquirida por Google que, redondeando un poco, ganó el último premio Nobel de Medicina por el sistema AlphaFold de predicción de la estructura de las proteínas. Los genes y las proteínas son, literalmente, textos, o secuencias de símbolos que significan cosas. Dominar el proteinés se trata, en el fondo, del mismo problema que aprender latín.
Los humanos seguimos divididos desde la escuela entre ciencias y letras, pero la IA no tiene esas manías. Los mismos modelos grandes de lenguaje (large language models, LLM) que subyacen a ChatGPT sirven también para crear imágenes o predecir la forma de las moléculas biológicas. La máquina no es de ciencias ni de letras. Pertenece a la tercera cultura que soñó C. P. Snow en 1959.
Los LLM solo funcionan tras entrenarse con cantidades masivas de datos generados por nosotros los humanos. Por ejemplo, ChatGPT se puede tragar la internet entera y toda la historia de la literatura universal antes del desayuno. Los científicos han entrenado a Aeneas con tres de las mayores bases de datos de inscripciones latinas (epigrafía, en la jerga). Eso son 177.000 inscripciones, 9.000 de ellas con imágenes, y que abarcan desde el siglo VII antes de Cristo hasta el VIII de nuestra era. Y por una vez el sistema no funciona como una caja negra, puesto que aporta una lista de inscripciones similares a la nueva, y reconoce cuáles de ellas han sido más relevantes para el resultado que ofrece.
Los autores han sometido a Aeneas a una competición con 23 expertos de carne mortal. Y hay que decir que los humanos lo han hecho muy bien, acertando la fecha de las inscripciones con un margen de solo 31 años. Aeneas ha atinado con un margen de 13 años. No es una goleada, pero sirve para pasar a la final. Cuando se permite a los expertos colaborar con Aeneas, su acierto se hace tan preciso como el de la máquina.
Snow nos dio la oportunidad de unificar la enseñanza de las ciencias y las letras, y es justo decir que la hemos desaprovechado. Quizá Aeneas, el robot de letras, pueda ayudarnos a cruzar ese puente precario sobre el abismo.
No hay comentarios:
Publicar un comentario