“Gosto do meu café como gosto da minha guerra. Fria.”

Alguns anos após cientistas da Universidade de Washington terem escrito um programa que acrescentava corretamente, 72% das vezes, “foi o que ela disse” no final de uma frase, os investigadores da Universidade de Edimburgo decidiram tentar o mesmo. Com grandes quantidades de dados linguísticos, treinaram um modelo para criar piadas seguindo a estrutura “eu gosto do meu X como gosto do meu Y, Z”, produzindo piadas, como a vista acima, ou a muito menos engraçada “gosto das minhas mulheres, como gosto da minha máquina fotográfica… prontas a ‘flashar’.”

Claro, parece uma piada, e soa a piada, mas muitos argumentam que falta a parte fundamental quando se trata de comicidade – simplesmente não é engraçado.

Acontece que, embora os computadores sejam infinitamente melhores do que nós em muitas tarefas, simplesmente não são bons a fazer piadas. Mas isso não impediu os investigadores de criarem algoritmos geradores de comédia. E, mesmo que seja muito satisfatório assistir a uma luta entre máquinas para criar uma piada decente, a razão pela qual tantos académicos e cientistas estão a explorar o fascinante mundo do humor computacional, não é unicamente extravagante.

Developers, cientistas, gerentes de produto e académicos estão a trabalhar para tornar as interações humano-máquina tão naturais e pessoais como uma conversa entre dois amigos. Para isso, têm de lidar com o processamento de língua natural e ensinar os computadores a processar, a analisar e a replicar as estruturas da nossa língua. E isso não é uma tarefa fácil. De facto, como aponta um manual de Linguística Matemática, “estas tarefas são tão difíceis que Turing poderia precisamente tornar a conversa fluente em linguagem natural a peça central do seu teste de inteligência”.

Embora, necessariamente, não o concluas depois de uma série de “vídeos caseiros mais engraçados” no Youtube, o humor é uma das formas mais sofisticadas de inteligência humana – escatológica e tudo. Isso acontece em parte, porque a linguagem humorística geralmente usa expressões complexas, ambíguas e incongruentes, que exigem uma interpretação semântica profunda.

E é por isso que falta investigação de modelagem profunda de humor – é demasiado complexo, ou como os investigadores o chamam, é IA-completo – uma categoria reservada para as questões de IA mais difíceis, em que resolver um problema computacional específico é tão difícil quanto resolver o problema central da questão da Inteligência Artificial.

Encontrar a piada

Há milhares de anos que tentamos descortinar uma fórmula para explica o humor, de Aristóteles a Freud, de Kierkegaard a Monty Python. A primeira teoria do humor (ou melhor, a primeira que conhecemos) remonta à Grécia Antiga. Conhecida como a Teoria da Superioridade, propõe que o humor provém do infortúnio dos outros. Embora seja uma explicação perfeita para quando soltamos uma gargalhada quando alguém escorrega na calçada, não explica muito mais. Mais tarde, no início do 20th século, Freud surge com a Teoria do Alívio. Ele afirma que o humor é uma libertação dos nossos desejos internos acumulados, que acontece quando o consciente permite a expressão de pensamentos que geralmente estavam proibidos. Ótimo para o humor sujo, sarcástico ou hostil, mas ainda assim, nem todas as piadas se enquadram nessa categoria.

Então, nos anos 70, os linguistas uniram-se por trás da Teoria da Incongruência: a ideia apoiada pelos filósofos Kant e Schopenhauer de que nos rimos das violações das nossas expectativas. Uma piada é, portanto, uma empresa de duas partes – requer uma preparação, uma criação de expectativas e um argumento final, quando essa expectativa é subvertida.

Esta teoria foi uma das primeiras com que Didi Yang, uma professora assistente da Escola de Computação Interativa da Georgia Tech, se deparou. Em 2015, quando ela estava em Carnegie Mellon, Yang costumava questionar-se sobre o humor. Não que ela ligue muito a piadas: “Não sou uma pessoa engraçada, mas gosto de humor”. O humor é crucial para compreender a comunicação humana. “Acho que se os nossos computadores entenderem o humor, poderão entender melhor o verdadeiro significado da linguagem humana”, disse ela. “Se pensares em todos esses agentes de conversação como o Google Assistant, a Alexa ou a Siri, se eles tivessem uma melhor compreensão do humor, poderiam tomar melhores decisões para melhorar a experiência do utilizador”.

O humor poderia ajudá-la a construir sistemas inteligentes capazes de fornecer interações naturais e empáticas homem computador. Por isso, conduziu um projeto de investigação independente para tentar criar modelos computacionais para descobrir as estruturas por trás do humor, reconhecê-lo e até identificar que palavras estimulam o humor de uma pessoa numa frase.

Yang mergulhou a fundo nas teorias linguísticas do humor, identificando várias estruturas semânticas para cada uma delas, que poderia usar para treinar modelos. Uma delas era a teoria da incongruência – que explica por que achamos hilariantes as fotos de macacos vestidos com fatos e malas de negócios ou, citando outra piada relacionada com macacos: “Porque é que o macaco caiu da árvore? Porque estava morto.”

As estruturas latentes por trás do humor

Na sua investigação, Yang estudou várias estruturas latentes por trás do humor, presentes não apenas na teoria da incongruência, mas também noutras três:

  • Ambiguidade. O humor e a ambiguidade costumam juntar-se quando um ouvinte está à espera de um significado, mas é forçado a usar outro.

Já ouviste falar do tipo a quem cortaram o lado esquerdo? Ele agora é todo às direitas.

  • Estilo fonético. Alguns estudos linguísticos mostram que as propriedades fonéticas das piadas – aliteração, repetição de palavras, rima – podem ser tão ou mais importantes como o próprio conteúdo. Muitos trocadilhos têm um certo efeito cómico, mesmo quando a piada não é necessariamente engraçada. Por exemplo:

Quando viste um centro comercial, viste os centros todos.

  • Efeito interpessoal – esta teoria explica que o humor está essencialmente associado ao sentimento e à subjetividade, especialmente em contextos hostis. É por isso que frases como a que está abaixo são (mais ou menos) engraçadas, embora possas argumentar que quase não existe sofisticação.

A tua aldeia ligou. Eles querem o seu idiota de volta.

Para conseguir um reconhecimento automático do humor e extração de âncoras humorísticas – palavras como “Truz, truz”, que dão pistas sobre uma interação humorística – Yang precisava de um conjunto de dados com exemplos humorísticos e não humorísticos. “Não foi fácil fazer a investigação”, disse Yang. “Era um tópico relativamente pouco investigado, demoramos muito tempo a obter os dados”. Ela usou o ” Pun of the Day ” – a maior coleção de trocadilhos engraçados da internet – e o conjunto de 16000 dados de uma linha. Como grupo de controlo, usou os cabeçalhos do AP News, The New York Times e Yahoo! Resposta e Provérbio.

Para identificar as âncoras humorísticas – as palavras que dão sentido à piada – Yang e os seus colegas analisaram cada uma das frases que satisfaziam os critérios de uma das estruturas humorísticas. Considera a seguinte piada:

Fico feliz por saber língua gestual; dá-me sempre uma mãozinha.

As âncoras humanas não são as palavras como “saber” ou “fico” e não são os pares “saber” e “mãozinha”. Pelo contrário, é a combinação de “língua gestual” e “mãozinha” que permite a piada – não importa o quão seca seja. Cada um dos candidatos a âncora recebe uma pontuação de humor prevista, que é calculada por um classificador de reconhecimento de humor treinado em todos os pontos de dados.

Os candidatos a âncora humorística que tenham a maior pontuação são devolvidos então como o conjunto de âncoras. Os resultados foram promissores – eles usaram outros métodos de reconhecimento de humor, como Bag of Words, Language Model e Word2Vec, como linhas de base, e obtiveram melhores resultados.

Mas ainda há muito trabalho para ser feito. Especialmente porque o humor não se limita apenas às palavras.

É tudo à base de T * I * M * I * N * G *

Há uma piada antiga que é mais ou menos assim:

“Pergunte-me o segredo da boa comédia.”
“Qual é o seg—”
“Timing!”

Todos nós vimos a mesma piada a cair bem quando certos comediantes a dizem, apenas para sair mal quando a deixas escapar numa tentativa equivocada de ser engraçado numa reunião de família. Mas, como Rhodri Marsden uma vez indicou, “isso deve-se a uma combinação de reputação, momento, presença e tempo.”Por razões óbvias, treinar modelos para reconhecer o tempo não é tão fácil quanto pedir que eles detetem um simples “foi o que ela disse” no final de uma frase qualquer.

Mas, ainda assim, existem alguns estudos interessantes sobre o assunto. Amruta Purandare e Diane Litman, do Programa de Sistemas Inteligentes da Universidade de Pittsburgh, analisaram 2 horas de áudio, de um total de 75 cenas de seis episódios diferentes de Friends, marcando cada fala que é seguida de uma risada.

Eles examinaram certas características acústicas e linguísticas, como ritmo, timbre, número de palavras e com que frequência certas palavras são repetidas. A análise deles confirmou algo que sabemos desde o início – há diferenças significativas nessas características prosódicas da fala humorística e não humorística, consistentes em diferentes géneros e pessoas. Nas interações mais engraçadas, os oradores tendem a ter um ritmo, tom e energia mais altos, o que é consistente com investigações anteriores que mostram que estes recursos estão associados a estados emocionais positivos, como o confiante, com maior probabilidade de aparecer em comunicações bem-humoradas.

Também mostrou que, sem surpresa, Chandler tem as interações mais engraçadas nessas 75 cenas (22,8% de todas as piadas são dele), e que as faixas de riso – cuja popularidade declinou felizmente desde os anos 80 e 90 – são realmente boas para alguma coisa.

A pesquisa em humor computacional ainda está nos estágios iniciais, mas os computadores parecem estar cada vez melhores nisso. Ainda há um longo caminho pela frente, mas, felizmente, esse caminho é pavimentado com maus trocadilhos e onliners toscas. E enquanto o júri ainda está em dúvida se “eu gosto do meu café como da minha guerra. Frio.” é engraçado ou não, eu, por um lado, acho hilariante. Sou uma mulher de gostos simples. Se parece uma piada, e soa como uma piada, provavelmente é uma piada.