« J’aime mon café comme j’aime ma guerre. froid. »

Quelques années après que deux scientifiques de l’Université de Washington écrivirent un programme qui ajoutait avec précision « c’est ce qu’elle a dit » à la fin d’une phrase dans 72 % des cas, des chercheurs de l’Université d’Édimbourg décidèrent d’essayer. Ils formèrent un modèle grâce à de grandes quantités de données linguistiques pour créer des blagues suivant la structure « J’aime mon X comme j’aime mon Y, Z », produisant des blagues comme celle ci-dessus, ou celle-ci, beaucoup moins drôle : « J’aime mes femmes comme j’aime mon appareil photo… prêt à flasher. »

Bien sûr, cela ressemble à une blague et sonne comme une blague, mais beaucoup soutiennent qu’il manque la partie essentielle en matière d’humour : ce n’est tout simplement pas drôle.

Il s’avère que bien que les ordinateurs soient infiniment meilleurs que nous dans bien des tâches, ils sont tout simplement très mauvais pour raconter des blagues. Mais cela n’a pas empêché les chercheurs de créer des algorithmes générateurs d’humour. Même s’il doit être marrant de regarder une machine avoir des difficultés à trouver une bonne blague, la raison pour laquelle tant d’universitaires et de scientifiques étudient le monde fascinant de l’humour informatique n’est pas purement fantaisiste.

Les développeurs, les scientifiques, les responsables produits et les universitaires travaillent tous à rendre les interactions homme-machine aussi naturelles et personnelles qu’une conversation entre deux amis, et pour cela, ils doivent s’attaquer au traitement du langage naturel, en apprenant aux ordinateurs à traiter, analyser et reproduire les structures de notre langue. Ce n’est pas une mince affaire. En fait, comme le souligne un manuel de linguistique mathématique, « ces tâches sont si difficiles que Turing aurait pu à juste titre mettre la conversation fluide en langage naturel au cœur de son test d’intelligence ».

Bien qu’on n’en dirait pas autant après avoir visionné une série de « vidéos personnelles les plus drôles » sur Youtube, l’humour est l’une des formes les plus sophistiquées de l’intelligence humaine, même l’humour scatologique et autres. Cela est dû en partie au fait que le langage humoristique utilise généralement des expressions complexes, ambiguës et incongrues qui nécessitent une interprétation sémantique approfondie.

Et c’est pourquoi la recherche sur l’apprentissage profond de l’humour fait défaut (c’est trop complexe, ou comme disent les chercheurs, ce n’est pas « IA-complet ») ; c’est une catégorie réservée aux problèmes d’IA les plus difficiles, dans laquelle résoudre un problème informatique particulier est aussi ardu que résoudre la question même de l’intelligence artificielle.

Trouver LA blague

Nous essayons de déchiffrer une formule qui peut expliquer l’humour depuis des milliers d’années, d’Aristote à Freud, de Kierkegaard aux Monty Python. La première théorie de l’humour (ou plutôt, la première que nous connaissions) remonte à la Grèce antique. Connue sous le nom de théorie de la supériorité, elle avance que l’humour est basé sur les malheurs des autres. Bien que ce soit une explication parfaite de la raison pour laquelle nous gloussons quand quelqu’un glisse sur le trottoir, cela n’explique pas tout. Beaucoup plus tard, au début du 20th siècle, Freud propose la théorie du soulagement. Il prétend que l’humour est une libération de nos désirs intérieurs accumulés, que cela se produit lorsque le conscient permet d’exprimer des pensées qui étaient normalement interdites. Idéal pour l’humour grossier, sarcastique ou violent, mais toutes les blagues ne relèvent pas de cette catégorie.

Puis, dans les années 70, les linguistes soutinrent la théorie de l’incongruité-résolution : l’idée véhiculée par les philosophes Kant et Schopenhauer que l’on rit de la violation bénigne des attentes de l’auditeur. Une plaisanterie est donc un processus en deux parties : elle nécessite une mise en place, une création d’attentes et une chute, lorsque cette attente est « déçue ».

Cette théorie a été l’une des premières découvertes de Didi Yang, professeur adjointe à la School of Interactive Computing du Georgia Tech. En 2015, lorsqu’elle étudiait à l’université de Carnegie Mellon, Yang se posait des questions sur l’humour. Non pas qu’elle s’intéresse particulièrement aux blagues : « Je ne suis pas quelqu’un de forcément drôle, mais j’aime l’humour. » L’humour est un élément crucial pour comprendre la communication humaine. « Je pense que si nos ordinateurs arrivent à comprendre l’humour, ils arriveront à mieux comprendre le vrai sens du langage humain », a-t-elle déclaré. « Lorsqu’on pense à tous ces assistants virtuels tels que l’Assistant Google, Alexa ou Siri, s’ils avaient une meilleure compréhension de l’humour, ils pourraient prendre de meilleures décisions pour améliorer l’expérience utilisateur. »

L’humour pourrait l’aider à créer des systèmes intelligents pouvant fournir des interactions homme-ordinateur naturelles et empathiques. Elle a donc mené un projet de recherche indépendant pour essayer de créer des modèles informatiques qui découvriraient les structures de l’humour, reconnaîtraient ce dernier et même identifieraient les mots humoristiques dans une phrase.

Yang a étudié de façon approfondie les théories linguistiques de l’humour, identifiant plusieurs structures sémantiques pour chacune d’entre elles, qu’elle pourrait utiliser pour former les modèles. L’une d’entre elles était la théorie de l’incongruité ; celle qui explique pourquoi nous trouvons hilarantes des photos de singes portant des costumes et des dossiers commerciaux, ou, pour citer une autre plaisanterie sur le thème du singe : « Pourquoi le singe est-il tombé de l’arbre ? Parce qu’il était mort. »

Les structures sous-jacentes de l’humour

Dans ses recherches, Yang a étudié plusieurs structures sous-jacentes de l’humour présentes non seulement dans la théorie de l’incongruité, mais aussi dans trois autres :

  • Ambiguïté. L’humour et l’ambiguïté se rejoignent souvent lorsqu’un auditeur attend une signification, mais qu’il s’en voit présenter une autre.

Mieux vaut tenir le couteau de la main droite que passer l’arme à gauche.

  • Style phonétique. Certaines études linguistiques montrent que les propriétés phonétiques des blagues (allitérations, répétition de mots, rimes) peuvent être aussi importantes, sinon plus, que le contenu lui-même. Beaucoup de boutades ont un certain effet comique même lorsque la blague n’est pas nécessairement drôle. Par exemple :

Le ver vert va vers le verre vert.

  • Effet interpersonnel : cette théorie explique que l’humour est essentiellement associé au sentiment et à la subjectivité, en particulier dans des contextes d’hostilité. C’est pourquoi des phrases comme celle ci-dessous sont drôles (plus ou moins), bien qu’on puisse argumenter qu’il n’y a pas beaucoup de sophistication.

Votre village a appelé. Il veut récupérer son idiot.

Pour effectuer une reconnaissance automatique de l’humour et extraire l’ancrage de l’humour (des mots comme « Toc, toc, toc » qui indiquent une interaction humoristique), Yang avait besoin d’un ensemble de données avec des exemples humoristiques et non humoristiques. « Ce n’était pas facile de faire ces recherches, » a déclaré Yang. « C’était un sujet relativement peu étudié, nous avons passé beaucoup de temps à obtenir les données. » Elle a utilisé « Pun of the Day », la plus grande collection de jeux de mots et calembours sur Internet, et l’ensemble de données de 16000 boutades. Comme groupe de référence, elle a utilisé les titres d’AP News, du New York Times, de Yahoo ! Answer and Proverb.

Pour identifier les ancrages (les mots à l’origine de la blague) Yang et ses collègues ont analysé chaque calembour qui satisfaisait aux critères d’une des structures humoristiques. Considérez le calembour suivant :

« I am glad that I know sign language; it is pretty handy. » (« Je suis content de connaître le langage des signes ; c’est bien pratique », handy signifiant pratique, mais faisant également référence à la main(hand))

Les ancrages humains ne sont pas les mots comme « know » ou « am », et ce ne sont pas les paires « know » et « pretty handy ». C’est plutôt la combinaison de « sign language » et de « pretty handy » qui fait rire, peu importe le côté pince-sans-rire. Chacun des candidats d’ancrage obtient un score d’humour prévu, qui est ensuite calculé par un classificateur de reconnaissance d’humour formé sur tous les points de données.

Les candidats d’ancrage d’humour qui ont le meilleur score sont ensuite renvoyés en tant qu’ensemble d’ancrage. Les résultats étaient prometteurs ; d’autres méthodes de reconnaissance de l’humour ont été utilisées comme bases de référence, comme la représentation par sac de mots, les modèles de langage et Word2Vec, et l’équipe a obtenu de meilleurs résultats.

Mais il reste encore beaucoup de travail à faire. D’autant plus que l’humour ne concerne pas que les mots.

Tout est question de T * I * M * I * N * G *

Il y a une vieille blague qui donne à peu près ceci :

« Demandez-moi le secret d’un excellent humour. »
« Quel est le sec… »
« Le timing ! »

Nous avons tous vu la même blague faire l’effet escompté lorsqu’elle était racontée par certains humoristes, alors qu’elle tombait à plat lorsque c’était vous qui la faisiez en tentant maladroitement d’être drôle lors d’une réunion de famille. Mais, comme l’a déjà souligné Rhodri Marsden, «cela est dû à une combinaison de réputation, de dynamisme, de présence et de minutage.» Pour des raisons évidentes, former des modèles à reconnaître le timing n’est pas aussi simple que de leur demander de détecter un simple « c’est ce qu’elle a dit » à la fin d’une phrase donnée.

Mais il y a des études intéressantes à ce sujet. Amruta Purandare et Diane Litman de l’Intelligent Systems Program de l’Université de Pittsburgh ont analysé 2 heures de contenu audio, d’un total de 75 scènes de six épisodes différents de « Friends », repérant chaque réplique qui était suivie de rires préenregistrés.

Elles ont examiné certaines caractéristiques acoustiques et linguistiques, telles que le rythme, le ton, le nombre de mots et la fréquence de répétition de certains mots. Leur analyse a confirmé quelque chose que l’on savait depuis le début ; il existe des différences significatives dans ces caractéristiques prosodiques des discours humoristique et non humoristique, uniformes peu importent les sexes et locuteurs. Dans les interactions plus drôles, les locuteurs ont tendance à avoir un rythme, un ton et une énergie plus élevés, ce qui est conforme aux recherches antérieures qui montrent que ces caractéristiques sont associées à des états émotionnels positifs tels que la confiance, qui sont plus susceptibles d’apparaître dans des interactions humoristiques.

Elles ont également montré que, sans surprise, c’est Chandler qui a les interactions les plus amusantes dans ces 75 scènes (22,8 % de toutes les blagues sont de lui), et que les rires préenregistrés, dont la popularité a heureusement décliné depuis les années 80 et 90, servent en fait à quelque chose.

La recherche sur l’humour informatique en est encore à ses débuts, mais les ordinateurs semblent s’améliorer de plus en plus dans ce domaine. Il y a encore un long chemin à parcourir, mais heureusement, cette route est pavée de mauvais jeux de mots et de blagues lourdingues. Et tandis que le jury n’a toujours pas décidé si « j’aime mon café comme j’aime ma guerre. Froid. » est drôle ou pas, pour ma part, je trouve ça hilarant. Je suis une femme aux goûts simples. Si cela ressemble à une blague et sonne comme une blague, c’en est probablement une.