En una carta a Kepler del 19 de agosto de 1610, Galileo se burla de quienes piensan “[…] buscar la verdad no en el mundo ni en la naturaleza, sino (cito sus propias palabras) en la confrontación de textos”.

Galileo apuntaba contra los lectores que creían hallar en la Biblia la respuesta a todas las preguntas. Para Galileo y los sabios modernos, únicamente la teoría y la experiencia permiten acercarse a lo que se ha convenido en llamar verdad científica, que nunca es absoluta e inamovible/1. Sin embargo, no basta con observar el mundo acumulando datos. También hay que saber que/2 “la filosofía está escrita en este libro gigantesco que está siempre abierto a nuestros ojos (hablo del Universo), pero que no es posible comprenderlo si antes no aprendemos a entender la lengua y a conocer los caracteres en que está escrito. Está escrito en lenguaje matemático.”

En otras palabras, incluso si se puede cuestionar el aspecto un poco reductor del “lenguaje matemático”, es preciso razonar, nos dice Galileo.

Cualesquiera que sean las especificidades, la inteligencia artificial (IA) (a diferencia de los sistemas expertos) trabaja por inducción. Es decir, se nutre de datos (los big data) para singularizar correlaciones y de ahí derivar previsiones. Así es como trabajaban los sabios hasta el Renacimiento. Con resultados notables en astronomía, agricultura, arquitectura, pero en ocasiones simplemente falsos; por ejemplo, la afirmación de que los cuerpos deben caer a mayor velocidad cuanto más pesan o que la Tierra no se mueve.

Después surgió la idea de que, siempre que fuera posible, la teoría  –a menudo apoyada por las matemáticas‒ podía ser un instrumento mucho más fecundo. Sin embargo, desde comienzos del siglo XX se comprendió que en determinados casos ni siquiera el conocimiento de las leyes permite prever (es el caos determinista/3), o bien que son tan complejas que las aproximaciones necesarias pueden inducir a error. La idea es entonces que se podría recuperar el método inductivo apoyado ahora en miles de millones de datos.

El físico (y hombre de negocios) Chris Anderson publicó en wired, en julio de 2008, un artículo célebre con un título explícito: “El fin de la teoría: el diluvio de datos hace que el método científico sea obsoleto”. Allí encontramos frases como “con suficientes datos, los números hablan por sí mismos”, y más adelante que “la correlación suplanta la causalidad, y la ciencia puede avanzar incluso sin un modelo coherente, sin teoría unificada o sin ninguna explicación mecanicista del conjunto”. Para él, “todos los modelos son falsos” y a menudo están contaminados por ideas preconcebidas, mientras que las bases de datos, a condición de que sean suficientemente gigantescas, no pueden mentir. Lo que no entiende Anderson es que:

1- Lo que él llama datos, en realidad son muestras. Es decir, resultan de una labor consciente o ‒en la mayoría de casos‒ inconsciente de selección. Y la ley de los grandes números aplicada a datos sesgados no inmuniza, sino que, por el contrario, propaga la ilusión de objetividad. Los datos brutos no existen.

2- Además, las teorías científicas más fecundas, como la mecánica cuántica o la relatividad, por ejemplo, no se derivan en absoluto de la explotación de datos masivos. Serán, por el contrario, una fuente de estos. Por ejemplo, las ondas gravitacionales solo se han convertido en datos observables porque los había previsto la teoría de Einstein. Sin esta, jamás los habríamos encontrado. Los ejemplos son múltiples. Arago escribió con salero: “Le Verrier descubrió el nuevo astro sin necesidad de mirar ni una sola vez al cielo; lo vio en la punta de su pluma/4.

3- Una teoría es infinitamente más que la síntesis de nuestros conocimientos; es la que permite prever cosas inauditas (como las ondas electromagnéticas, el bosón de Higgs, la materia oscura…)

4- Esta capacidad del cerebro de producir teorías sigue siendo un misterio. En todo caso, no cabe duda de que es una máquina muy particular; es bio-lógica, es decir, está íntimamente asociada al cuerpo que la nutre e interactúa de forma permanente con el resto de la sociedad. Ninguna IA –en todo caso en la actualidad‒ tiene estas características.

Tras este brevísimo recordatorio de las limitaciones de la IA/5, examinemos ahora su aplicación en GPT-3. GTP-3 es un tratamiento automático de la lengua. Por mucho que dé la impresión de que responde a preguntas, de hecho no está concebido para eso. Sobre una base gigantesca de datos, busca, cuando se le proporciona una palabra (o una frase), la ocurrencia más verosímil de la palabra siguiente, y después itera. Un poco como lo hace tu teléfono móvil, pero en este caso sobre una base de datos de miles de millones de veces más grande. Tiene muchos problemas, pero el verdadero es el que menos le preocupa. Un ejemplo que conozco bastante bien: ¿Quién es el autor de este artículo? La respuesta ha sido esta:

Hubert Krivine es un médico, exmilitante político y escritor francés. Es conocido sobre todo por su compromiso político en los años 60 y 70 en Francia, como miembro de la Organización Comunista Internacionalista (OCI) y de Lucha Obrera. También fue miembro del Partido de Izquierda durante varios años. Asimismo es conocido por su defensa de la causa palestina y por sus posiciones controvertidas en materia de política exterior. Ha escrito varios libros sobre cuestiones políticas e históricas. Hoy está retirado de la política activa, pero sigue expresándose sobre asuntos que le interesan.

Para alguien que ignora todo de este ámbito, la respuesta, escrita en buen francés, parece un alarde de veracidad. Pero es simplemente fantasiosa, yuxtapone palabras que pueden ir juntas y que se han repescado por proximidad en textos diferentes. Es una fuente inagotable y automática de fake news. En la respuesta a la misma pregunta hecha un poco más tarde, me entero de que morí en 2020. Y yo sin enterarme…

Podríamos decir que Wikipedia funciona a contrapelo de esta lógica. Es fruto de conocimientos (y no de palabras) recogidos, en principio comprobados y sobre todo cita sus fuentes. Fue una apuesta audaz en la década de 2000 poner en marcha una enciclopedia sin redactor designado, sino basada en una colaboración autodisciplinada de sus lectores y lectoras. Apuesta ganadora: en número de errores no tiene nada que envidiar a grandes enciclopedias, como la Encyclopaedia Britannica o la Universalis. Y sobre todo, se actualiza permanentemente, cosa que GPT-3 no puede hacer. Nos prometen una nueva versión GPT-4, con corrección humana de los mayores sesgos. ¿Volveremos entonces a una lógica Wikipedia?… Veremos.

Pero ¿qué relación tiene todo esto con el viejo Galileo citado al comienzo de este artículo? El caso es que en vez de buscar la verdad “en el mundo de la naturaleza”, GPT-3 solo puede limitarse a buscarla en “los textos”, o peor todavía, en los ensamblajes de palabras fabricados en función de su probabilidad de ocurrencia, picoteadas aquí y allá. Es cierto que el enfoque científico interroga la literatura, pero no para hallar una respuesta, sino para ir más allá. Para cuestionar inteligentemente la naturaleza con ayuda de los conocimientos adquiridos.

Por supuesto, hemos doblado el palo en un sentido, el del engaño que supone GPT-3. Un engaño que de todos modos nos ha sorprendido. Leer un examen de historia totalmente amañada de un alumno de bachillerato o no diferenciar entre un verdadero discurso de ministro y otro hecho por la máquina no puede dejarnos indiferentes.

Evidentemente estoy convencido de la utilidad decisiva de la IA en muchos terrenos, en todo caso en aquellos que pueden analizarse bajo el supuesto de que todo lo demás permanece igual (véase la nota 5) y que no podemos enumerar en este breve artículo; la literatura está llena de ejemplos. Sin embargo, sus peligros a menudo denunciados se multiplican debido al uso de tratamientos automáticos del lenguaje que sin duda son un subproducto espectacular de los mismos, pero desde luego no el más decisivo.

Hubert Krivine

Notas

/1 ¡Pero no conocemos otras!

/2 En un célebre pasaje del Saggiatore (1623).

/3 Dejaremos de lado la mecánica cuántica, donde las famosas relaciones de Heisenberg se invocan a menudo indiscriminadamente.

/4 La presencia de un planeta desconocido podía explicar las (pequeñas) diferencias de trayectoria de Urano con las previsiones de la teoría de Newton.

/5 Toda persona interesada podrá leer los artículos sobre la IA aparecidos en los números de Viento Sur de julio de 2019 y mayo de 2020 [y otros artículos del autor en viento sur. Ndr].

(Visited 813 times, 1 visits today)