“Mi piace la mia birra come mi piace la mia guerra. Fredda.”

Qualche anno dopo che due scienziati dell’Università di Washington hanno scritto un programma che aggiungeva “questo è quello che lei ha detto” correttamente alla fine di una frase il 72% delle volte, i ricercatori dell’Università di Edimburgo hanno deciso fare una prova. Hanno formato un modello su grandi quantità di dati linguistici, per creare delle battute seguendo la struttura “Mi piace la mia X come mi piace la mia Y, Z”, producendo battute come quella sopra o come la molto meno divertente “Mi piacciono le mie donne come mi piace la mia macchina fotografica… pronte a scattare. “

Certo, sembra una battuta e suona come una battuta, ma molti sostengono che manchi la parte fondamentale in fatto di comicità — semplicemente non è divertente.

A quanto pare, sebbene i computer siano infinitamente migliori di noi in molte attività, non sono un gran che nel fare battute. Ma ciò non ha impedito ai ricercatori di creare algoritmi che generare umorismo. E nonostante sia divertente guardare una macchina sforzarsi di inventare una battuta decente, la ragione per cui così tanti accademici e scienziati stiano esplorando l’affascinante mondo dell’umorismo computazionale non è di natura puramente stravagante.

Sviluppatori, scienziati, responsabili del prodotto ed accademici stanno tutti lavorando per rendere le interazioni uomo-macchina naturali e personali come una conversazione tra due amici e per questo, devono affrontare l’elaborazione del linguaggio naturale, insegnare ai computer ad elaborare, analizzare e replicare le strutture della nostra lingua. E non è un compito facile. In effetti, come sottolinea un manuale di Linguistica matematica, “questi compiti sono così difficili che Turing potrebbe ragionevolmente fare della conversazione fluente nel linguaggio naturale il fulcro del proprio test di intelligenza”.

Anche se non lo diresti dopo aver assistito ad una serie dei “video amatoriali più divertenti” su Youtube, l’umorismo è una delle forme più sofisticate d’intelligenza umana — scatologica e tutto il resto. In parte perché il linguaggio umoristico usa tipicamente espressioni complesse, ambigue ed incongrue, che richiedono un’interpretazione semantica profonda.

Ed è per questo che manca una ricerca approfondita sulla modellazione dell’umorismo — è troppo complessa, i ricercatori la chiamano AI-complete — una categoria riservata ai problemi di IA più difficili, per cui risolvere il particolare problema computazionale è difficile quanto risolvere la questione centrale dell’intelligenza artificiale.

Cercare la battuta

Stiamo cercando di trovare una formula che possa spiegare l’umorismo da migliaia di anni, da Aristotele a Freud, da Kierkegaard ai Monty Python. La prima teoria sull’umorismo (o meglio, la prima di cui siamo a conoscenza) risale all’antica Grecia. Conosciuta come Teoria della superiorità, suppone che l’umorismo derivi dalle disgrazie altrui. Sebbene sia una perfetta spiegazione del perché ci scappi una risatina quando qualcuno scivola sul marciapiede, spiega poco altro. Più tardi, all’inizio del secolo 20th, Freud presentò la Teoria del sollievo. Afferma che l’umorismo è una liberazione dell’accumulo dei nostri desideri interiori, che avviene quando il conscio consente l’espressione di pensieri che erano solitamente proibiti. Ottima per un tipo di umorismo sporco, sarcastico o ostile, ma ancora non tutte le battute rientrano in questa categoria.

Successivamente, negli anni ’70, i linguisti si sono riuniti dietro la Teoria dell’incongruenza: l’idea sfoggiata dai filosofi Kant e Schopenhauer per cui ridiamo delle violazioni delle nostre aspettative. Una battuta è dunque un’impresa in due parti — richiede un’impostazione, la creazione di aspettative ed una battuta finale, quando quell’aspettativa viene sovvertita.

Questa teoria è stata una delle prime in cui si è imbattuta Didi Yang, professoressa assistente alla School of Interactive Computing alla Georgia Tech. Nel 2015, quando era alla Carnegie Mellon, Yang era solita interrogarsi sull’umorismo. Non che fosse molto interessata alle battute: “Non sono una persona spiritosa, ma mi piace l’umorismo”. L’umorismo è una parte cruciale della comprensione della comunicazione umana. “Penso che se i nostri computer riuscissero a comprendere l’umorismo, potrebbero comprendere meglio il vero significato del linguaggio umano” dice. “Se pensi a tutti quegli agenti conversazionali come Google Assistant, Alexa o Siri, se avessero una migliore comprensione dell’umorismo potrebbero prendere decisioni migliori ed offrire una migliore esperienza all’utente.”

L’umorismo poteva aiutarla a costruire sistemi intelligenti in grado di fornire interazioni uomo-computer naturali ed empatiche, perciò ha condotto un progetto di ricerca indipendente per provare e creare modelli computazionali per scoprire le strutture dietro l’umorismo, riconoscerlo ed anche identificare quali sono le parole che suscitano l’umorismo in un frase.

Yang si immerse nelle profondità delle teorie linguistiche dell’umorismo, identificando diverse strutture semantiche per ciascuna, le quali potevano essere usate per formare i modelli. Uno di queste era la teoria dell’incongruenza — che spiega perché troviamo esilaranti le immagini di scimmie che indossano completi e i business case o per citare un’altra battuta a tema scimmia: “Perché la scimmia è caduta dall’albero? Perché era morta.”

Le strutture latenti dietro l’umorismo

Nella sua ricerca, Yang ha studiato diverse strutture latenti dietro l’umorismo, presenti non solo nella teoria dell’incongruenza, ma anche nelle altre tre:

  • Ambiguità. Umorismo e ambiguità si incontrano spesso quando un ascoltatore si aspetta un significato, ma viene costretto ad usarne un altro.

Hai sentito del ragazzo al quale è stata asportata tutta la parte sinistra? (in inglese “Did you hear about the guy whose whole left side was cut off?”) Ora sta bene (“He’s all right now” che in inglese può avere il significato ambiguo di “Ora è tutto destro”).

  • Stile fonetico. Alcuni studi linguistici mostrano che le proprietà fonetiche delle battute — allitterazione, ripetizione di parole, rima — possono essere tanto importanti quanto il contenuto stesso, se non di più. Molte one-liner hanno un certo effetto comico anche quando la battuta non è necessariamente divertente. Per esempio:

Quando hai visto un centro commerciale, hai visto un grande magazzino.

  • Effetto interpersonale — questa teoria spiega che l’umorismo è essenzialmente associato al sentimento e alla soggettività, specialmente in contesti condizionati dall’ostilità. Ecco perché frasi come quella qui sotto sono divertenti, anche se potresti sostenere che non ci sia quasi nessuna sofisticazione.

Il tuo villaggio ha chiamato. Vogliono indietro il loro idiota.

Per poter eseguire il riconoscimento automatico dell’umorismo e l’estrazione dell’ancora umoristica — parole come “Toc toc” che sono indizi di un’interazione umoristica — Yang aveva bisogno di un set di dati con esempi sia umoristici che non umoristici. “La ricerca non è stata facile”, ha detto Yang. “Era un argomento relativamente poco studiato, abbiamo impiegato molto tempo per recuperare i dati”. Ha usato Pun of the Day — la più grande collezione di giochi di parole divertenti su Internet — ed un set di dati contenente 16000 one-liner. Come gruppo di controllo ha usato i titoli da AP News, The New York Times e Yahoo! Risposta e proverbio.

Per identificare le ancore — le parole che innescano la battuta — Yang ed i suoi colleghi hanno analizzato ogni one-liner che soddisfacesse i criteri di una delle strutture umoristiche. Considera la seguente gag:

Ho imparato la lingua dei segni; è piuttosto maneggevole.

Le ancore umane non sono parole come “conoscere”, o “sono” e non sono le coppie “conoscere” e “piuttosto maneggevole”. Piuttosto, è la combinazione di “lingua dei segni” e “piuttosto maneggevole” che attiva la battuta — non importa quanto questa sia secca. A ciascuna delle candidate ancore viene assegnato un punteggio di umorismo previsto, che viene quindi calcolato da un classificatore di riconoscimento dell’umorismo che è stato formato su tutti i punti dei dati.

Le ancore umoristiche candidate che forniscono il punteggio più alto vengono quindi restituite come set di ancore. I risultati erano promettenti — hanno usato altri metodi di riconoscimento dell’umorismo, come Bag of Words, Language Model e Word2Vec, come base di riferimento e hanno ottenuto risultati migliori.

Ma c’è molto lavoro da fare, ancora. Soprattutto perché l’umorismo non riguarda solo le parole.

È tutta questione di T * E * M * P * O *

C’è una vecchia battuta che è più meno così:

“Chiedimi il segreto della buona comicità.”
“Qual è il segr—”
“Tempo!”

Tutti abbiamo ascoltato la stessa battuta atterrare magnificamente quando detta da certi comici e cadere invece piatta quando la si racconta ad una riunione familiare nel maldestro tentativo di essere divertente. Ma come ha sottolineato una volta Rhodri Marsden, “dipende da una combinazione di reputazione, momento, presenza e tempo.” Per ovvie ragioni, addestrare i modelli a riconoscere il tempo non così facile come chiedere loro di rilevare un semplice “questo è quello che lei ha detto” alla fine di ogni frase.

Tuttavia, ci sono alcuni studi interessanti al riguardo. Amruta Purandare e Diane Litman dal Intelligent Systems Program presso l’Università di Pittsburgh, hanno analizzato 2 ore di audio da un totale di 75 scene di sei diversi episodi di Friends, contrassegnando ogni turno di chi parlava al quale seguiva una risata.

Hanno esaminato alcune caratteristiche acustiche e linguistiche, come il tempo, il tono, il numero di parole e la frequenza con cui determinate parole vengono ripetute. Le loro analisi hanno confermato qualcosa che abbiamo sempre saputo — ci sono differenze significative nelle caratteristiche prosodiche del discorso umoristico e di quello non umoristico, costanti tra i diversi generi e oratori. Nelle interazioni più divertenti, gli oratori tendono ad avere un tempo, un’intonazione ed un’energia più elevati, il che è coerente con le ricerche precedenti che mostrano che queste caratteristiche sono associate a stati emotivi positivi come la fiducia, che hanno maggiori probabilità di apparire nelle comunicazioni umoristiche.

Ha anche mostrato che, come previsto, Chandler ha le interazioni più divertenti in quelle 75 scene (il 22,8% di tutte le battute sono sue) e che le registrazioni delle risate — la cui popolarità è fortunatamente decaduta dagli anni ’80 e ’90 — sono in effetti buone per qualcosa.

La ricerca sull’umorismo computazionale è ancora nelle primissime fasi, ma i computer sembrano fare costanti progressi. C’è ancora una lunga strada da percorrere, ma per fortuna quella strada è lastricata di pessimi giochi di parole e battute scadenti. E mentre la giuria sta ancora decidendo se “Mi piace la mia birra come mi piace la mia guerra. Fredda.” sia divertente o no, io, per me, la trovo divertente. Sono una donna dai gusti semplici. Se sembra una battuta e suona come una battuta, probabilmente lo è.