«El café me gusta como la guerra. Frío».

Hace un par de años, después de que dos científicos de la Universidad de Washington creasen un programa que añadía correctamente la expresión «that’s what she said» (eso es lo que dijo ella) al final de cada frase en el 72 % de las ocasiones, investigadores de la Universidad de Edimburgo decidieron intentar algo parecido. Entrenaron un modelo con grandes cantidades de datos lingüísticos con la estructura «me gusta X como me gusta Y, Z» para crear chistes como el anterior u otros menos graciosos, como por ejemplo, «I like my women like my camera… ready to flash» (en español, algo así como «las mujeres me gustan como las cámaras, listas para deslumbrar», lo cual hace referencia a que, en inglés, la palabra flash, además de utilizarse para referirse al flash de las cámaras, también significa «enseñar fugazmente los pechos»).

Está claro que parece un chiste y suena como tal, pero le falta lo fundamental, la gracia.

Aunque los ordenadores son infinitamente mejores que nosotros en muchas cosas, no se les da bien hacer chistes. No obstante, eso no ha impedido que los investigadores creen algoritmos generadores de chistes. Y a pesar de lo divertido que puede llegar a ser ver a una máquina esforzarse por hacer uno bueno, el motivo por el cual tantos académicos están realizando investigaciones en el fascinante ámbito del humor computacional no es puramente lúdico.

Desarrolladores, científicos, jefes de producto y académicos trabajan para que las interacciones entre personas y ordenadores sean tan naturales y personales como una conversación entre dos amigos. Para ello, necesitan abordar el procesamiento del lenguaje natural y enseñar a los ordenadores a procesar, analizar y replicar las estructuras de nuestro lenguaje. Y eso no es tarea fácil. De hecho, tal y como señala un manual de lingüística matemática, «es algo tan difícil que Turing podría basar perfectamente su test de inteligencia en la fluidez de una conversación en lenguaje natural».

Aunque no lo parezca después de ver una retahíla de vídeos graciosos caseros en Youtube, el humor (incluso el escatológico) es una de las manifestaciones más sofisticadas de la inteligencia humana. Esto se debe en parte a que el lenguaje humorístico suele utilizar expresiones complejas, ambiguas e incongruentes que requieren de una profunda interpretación semántica.

Y es por este motivo por el que falta investigación sobre el modelado profundo del humor, porque es demasiado complejo o, tal y como lo denominan los investigadores, IA-completo, una categoría reservada para los problemas más complicados relacionados con la IA, unas cuestiones tan difíciles de resolver como el interrogante principal que plantea la inteligencia artificial.

En busca del chiste perfecto

Llevamos miles de años tratando de hallar una fórmula que pueda explicar el humor, desde Aristóteles hasta Freud, desde Kierkegaard hasta los Monty Python. La primera teoría del humor (o más bien la primera que conocemos) se remonta a la antigua Grecia. Conocida como la teoría de la superioridad, plantea que las desgracias de los demás nos parecen graciosas. Aunque es una explicación perfecta de por qué soltamos una risita cuando alguien se resbala en la acera, no aclara mucho más. Mucho más tarde, a principios del siglo 20th, Freud propuso la teoría de la liberación. En ella, afirmaba que el humor es una liberación de nuestros deseos internos acumulados que ocurre cuando la conciencia permite expresar los pensamientos que normalmente estaban prohibidos. Una estupenda explicación para el humor picante, sarcástico u hostil. Pero no todos los chistes entran en estas categorías.

Más tarde, en los años 70, los lingüistas respaldaron la teoría de la incongruencia, que se basa en la idea de los filósofos Kant y Schopenhauer de que nos reímos del incumplimiento de nuestras expectativas. Por lo tanto, los chistes tienen dos partes, una de preparación, otra en la que se establecen las expectativas y, finalmente, una frase graciosa cuando se frustran dichas expectativas.

Esta teoría fue una de las primeras que planteó Didi Yang, profesora asistente de la School of Interactive Computing del Georgia Tech. En 2015, cuando estudiaba en la Universidad Carnegie Mellon, Yang sentía curiosidad por el humor. No es que le interesasen mucho los chistes: «No soy una persona graciosa, pero me gusta el humor». El humor es un elemento que resulta crucial a la hora de comprender la comunicación humana. «Creo que si los ordenadores pudiesen entender el humor, podrían comprender mejor el verdadero significado del lenguaje humano», afirma. «Los asistentes de voz (como Google Assistant, Alexa o Siri) podrían tomar decisiones que mejorasen la experiencia del usuario si entendiesen mejor el humor».

Creía que el humor podía ayudarla a crear sistemas inteligentes capaces de generar interacciones empáticas y naturales entre personas y ordenadores, así que llevó a cabo un proyecto de investigación independiente para tratar de crear modelos computacionales que permitiesen averiguar las estructuras implicadas en el humor y que fuesen capaces de reconocerlo e incluso de identificar aquellas palabras responsables de la gracia de una frase.

Yang estudió a fondo las teorías lingüísticas del humor e identificó varias estructuras semánticas de cada una de ellas que podía usar para entrenar a los modelos. Una de ellas era la teoría de la incongruencia, que explica por qué nos hacen gracia las imágenes de monos con traje y maletín o, por mencionar un chiste relacionado también con monos: «¿Por qué el mono se cayó del árbol? Porque estaba muerto».

Las estructuras latentes del humor

En su investigación, Yang estudió varias estructuras latentes del humor presentes no solo en la teoría de la incongruencia, sino también en otras tres:

  • Ambigüedad. El humor y la ambigüedad a menudo van de la mano, ya que a las personas les resulta gracioso dar por sentado un significado y después verse obligadas a considerar otro.

Hola, vengo a pedirle la mano de su hija. ¿Cuál, la mayor o la menor? Ah, ¿pero no tiene las dos manos iguales?

  • Estilo fonético. Algunos estudios lingüísticos muestran que las propiedades fonéticas de los chistes (aliteración, repetición de palabras o rima) pueden ser tan importantes, si no más, que el contenido en sí. Muchas frases tienen un cierto efecto cómico, incluso aunque el chiste no sea necesariamente gracioso. Por ejemplo:

¿Qué guarda Darth Vader en su congelador? Helado oscuro.

  • Efecto interpersonal : Esta teoría explica que el humor se asocia esencialmente con el sentimiento y la subjetividad, especialmente en contextos de hostilidad. Por este motivo, chistes como el siguiente tienen cierta gracia, aunque se podría argumentar que no son nada sofisticados.

Han llamado de tu pueblo. Quieren recuperar a su idiota.

Para lograr detectar y extraer las palabras clave (expresiones como «toc, toc» pueden darnos pistas sobre la naturaleza graciosa de lo que va a decirse a continuación), Yang necesitaba disponer de un conjunto de datos con ejemplos tanto humorísticos como no humorísticos. «No fue fácil llevar a cabo la investigación», dice Yang. «Era un tema relativamente poco investigado y tuvimos que dedicar mucho tiempo a recopilar datos». Utilizó Pun of the Day, la colección más grande de chistes de doble sentido de internet, y el conjunto de datos 16000 one-liner. Como grupo de control, utilizó los titulares de AP News, The New York Times, Yahoo! Answer y Proverb.

Para identificar las palabras clave de los chistes, Yang y sus compañeros analizaron cada una de las frases que cumplía con los criterios de alguna de las estructuras humorísticas. Por ejemplo, consideremos el siguiente chiste:

Mi hijo tiene un nuevo trabajo en el que está como pez en el agua. ¿Qué hace? Nada.

Los palabras clave no son «mi», «hijo» o «nuevo». En este caso, la gracia del chiste estaría más bien en la combinación de «pez en el agua» y «nada». A cada una de las candidatas a palabra o expresión clave se le asignó una puntuación en cuanto a gracia, que luego se computó mediante un clasificador de reconocimiento de humor al que se había entrenado en todos los puntos de datos.

Las candidatas que tenían una mayor puntuación pasaban a constituir el grupo de palabras o expresiones clave. Los resultados fueron prometedores. Utilizaron como referencia otros métodos de reconocimiento de humor como Bag of Words, Language Model o Word2Vec y lograron mejores resultados.

Pero aún queda mucho trabajo por hacer. Sobre todo porque el humor no se trata solo de las palabras.

La importancia fundamental del sentido de la O*P*O*R*T*U*N*I*D*A*D

Hay un chiste que dice algo así:

«Ask me the secret of a good comedy.
What’s the sec—.
Timing!» (en español: «Pregúntame el secreto de un buen chiste. ¿Cuál es el secreto? ¡Decirlo en el momento adecuado!». Se trata un juego de palabras, ya que «sec» es una abreviatura que se utiliza tanto para la palabra «secret», «secreto», como para la palabra «second», «segundo»).

Hay chistes con los que todo el mundo se ríe muchísimo cuando los cuenta un humorista, pero cuando somos nosotros los que los contamos en alguna reunión familiar, fracasamos estrepitosamente en nuestro intento por ser graciosos. Sin embargo, tal y como Rhodri Marsden señaló una vez, «esto se debe a una combinación de reputación, empuje, presencia y sentido de la oportunidad».Por razones obvias, entrenar modelos capaces de reconocer el momento oportuno no es tan fácil como pedirles que detecten un simple «eso es lo que dijo ella» al final de una frase.

No obstante, hay algunos estudios interesantes al respecto. Amruta Purandare y Diane Litman, del Intelligent Systems Program de la Universidad de Pittsburgh, analizaron 2 horas de audio de un total de 75 escenas de 6 episodios de Friends y marcaron el turno de cada una de las personas que hablaba que iba seguido por risas enlatadas.

Examinaron ciertas características acústicas y lingüísticas, como el tempo, el tono, el número de palabras y con qué frecuencia se repiten ciertas palabras. Su análisis confirmó algo que hemos sabido todo el tiempo: existen diferencias significativas en las características prosódicas del habla humorística y no humorística que coinciden en distintos géneros y hablantes. En las interacciones más graciosas, los hablantes tienden a utilizar un tempo, un tono y una energía más altos, lo cual coincide con lo que indican investigaciones previas, que muestran que estas características están asociadas con estados emocionales positivos como la confianza, cuya aparición es más probable en las comunicaciones de tipo humorístico.

También demostró que, como era de esperar, Chandler es el que dice las cosas más graciosas en esas 75 escenas (el 22,8 % de todos los chistes son suyos), y que las risas enlatadas, cuya popularidad ha disminuido (afortunadamente) desde los años 80 y 90, también tienen su utilidad.

Las investigaciones en el ámbito del humor computacional aún se encuentran en sus primeras etapas, pero los ordenadores mejoran cada vez más. Aún tenemos un largo camino por delante, pero, por suerte, este estará repleto de chistes malos de todo tipo. Y aunque el público aún no tiene claro si «el café me gusta como la guerra, frío» es gracioso o no, a mí sí que me lo parece. Soy una mujer de gustos sencillos. Si parece un chiste y suena como tal, seguramente lo sea.