Intervista con il responsabile della ricerca di Unbabel, appena aggiudicatasi 1,4 milioni di euro per realizzare la prossima generazione di modelli per la traduzione automatica

6 min read

Il responsabile della ricerca di Unbabel, André Martins, è stato insignito del prestigioso Starting Grant dello European Research Council (ERC) per il suo progetto di ricerca quinquennale DeepSPIN – Deep Structured Prediction in Natural Language Processing.

Con una moltitudine di nuove interfacce linguistiche in continuo aumento, quali gli assistenti digitali, le app di messaggistica e i bot di servizi al cliente, André ha giustamente affermato che queste tecnologie emergenti hanno ancora molta strada da fare:

Nonostante le molte innovazioni nel campo dell’elaborazione del linguaggio naturale, della traduzione automatica e del riconoscimento vocale, le reti neurali profonde non sono ancora dotate dei meccanismi strutturali chiave per svolgere i complessi compiti del mondo reale.

Ad esempio, gli attuali sistemi di traduzione automatica generano una parola alla volta, approccio che tende a propagare gli errori. E anche quando generano una traduzione ben fatta, troppo spesso perdono le informazioni contenute nel testo originale. Inoltre, le attuali reti neurali non sono in grado di ragionare in modo complesso, il loro addestramento richiede troppa supervisione e le loro decisioni non sono interpretabili dagli esseri umani.

Se vogliamo che l’intelligenza artificiale e gli esseri umani lavorino insieme, questo deve essere risolto.

Abbiamo bisogno di una nuova generazione di modelli, metodi e algoritmi di apprendimento automatico che tengano conto della struttura del linguaggio naturale consentendo di ragionare in modo approfondito sul mondo intorno a noi.

Con un finanziamento di 1,44 milioni di euro, André spera di reclutare per un periodo di cinque anni tre ricercatori post-doc e tre dottorandi al fine di spingere lo stato dell’arte nell’apprendimento profondo, nella traduzione automatica e nella valutazione della qualità della traduzione.

André ha parlato con noi per fornirci qualche dettaglio in più sul progetto:

[mkdf_separator class_name = “” type = “normal” position = “center” color = “” border_style = “” width = “” thickness = “” top_margin = “” bottom_margin = “”]

Intervista con il responsabile della ricerca di Unbabel, André Martins

Hai detto che “l’apprendimento profondo sta rivoluzionando il campo dell’elaborazione del linguaggio naturale”. In che modo? Puoi spiegarci cos’è l’apprendimento profondo?

Certo L’apprendimento profondo è un insieme di metodi di apprendimento statistico che aiutano le macchine ad imparare e a migliorare le proprie prestazioni grazie all’esperienza legata alla grande mole di dati elaborati. Ciò che distingue l’apprendimento profondo da altri metodi è la sua capacità di apprendere le rappresentazioni interne.

Le reti neurali sono l’esempio più conosciuto: sono formate da più unità (chiamate neuroni artificiali) collegate tra loro in più strati; i diversi strati catturano diversi livelli di rappresentazione (dalle parole alle locuzioni sino ai concetti semantici).

Negli ultimi 2-3 anni, questi modelli hanno raggiunto nuovi traguardi nelle attività di elaborazione del linguaggio naturale come la traduzione automatica, il riconoscimento vocale e la risposta alle domande.

Negli ultimi anni abbiamo assistito alla crescita di assistenti digitali come Alexa di Amazon o Siri di Apple, bot di servizi al cliente e app di messaggistica. Cosa pensi dell’evoluzione di queste tecnologie? Quanto siamo lontani dal vedere questi strumenti diventare simili all’uomo? Perché?

Queste tecnologie si sono evolute molto negli ultimi anni, al punto da diventare finalmente utili. Tuttavia, sono ancora molto, molto lontane dall’essere “umane”.

Spesso sembrano in grado di riprodurre correttamente il linguaggio e possono automatizzare e personalizzare molte attività quotidiane, ma ci vogliono solo un paio di cicli di interazione per rendersi conto che questi strumenti non sono in grado di ragionare in profondità per svolgere compiti più complessi. Per il momento, è ancora necessario combinare intelligenza artificiale e persone in carne ed ossa.

Questo progetto di ricerca metterà quindi insieme l’apprendimento profondo e la previsione strutturata per svolgere compiti impegnativi nell’elaborazione del linguaggio naturale, tra cui la traduzione automatica, la stima della qualità e l’analisi sintattica. Puoi spiegarci cosa intendi esattamente?

La lingua è piena di strutture: formiamo parole da morfemi, che poi combiniamo per formare delle locuzioni, che a loro volta formano frasi, e così via.

Comprendere questa struttura sintattica è la chiave per riuscire a capire il significato di una frase, come ad esempio Mentre stava mangiando la pizza arrivò. Siccome mangiando la pizza è una frase molto comune, possiamo facilmente essere portati a dare un’interpretazione errata. Nonostante gli ultimi progressi nell’apprendimento profondo per l’elaborazione del linguaggio naturale, i metodi esistenti non riescono ancora a gestire e comprendere questo tipo di strutture.

Ad esempio, i sistemi di traduzione automatica tipicamente generano parole da sinistra a destra, con voracità, per cui sono inclini a cadere in queste trappole. In questo progetto svilupperemo una nuova generazione di metodi di apprendimento profondo studiati appositamente per scoprire e gestire le strutture del linguaggio.

Inoltre, vogliamo che questi sistemi siano comprensibili dalle persone: quando ritengono che una traduzione è di bassa qualità, vogliamo che forniscano una motivazione per tale decisione, individuando le parole che sono tradotte in modo errato. Ciò renderà più facile per le persone e per l’intelligenza artificiale lavorare in modo collaborativo.

Puoi fornirci alcuni esempi dei compiti più impegnativi nell’elaborazione del linguaggio naturale?

Ogni compito che richiede la comprensione del linguaggio (espressione più forte della semplice elaborazione) è estremamente impegnativo. Oggi riusciamo a fare sempre meglio nel riconoscimento vocale. Ma come si passa da ciò alle macchine che capiscono le persone e le aiutano a risolvere i problemi? Per questo abbiamo bisogno della traduzione automatica (per eliminare le barriere linguistiche), della capacità di rispondere alle domande (per aiutare le persone nella ricerca delle informazioni) e di sistemi di dialogo orientati agli obiettivi (per lavorare in modo interattivo con le persone per svolgere compiti come ad esempio prenotare un volo). Questi sono compiti davvero difficili.

Cosa speri di raggiungere nel 2023, quando questa ricerca si concluderà?

Spero di avere un insieme di metodi di apprendimento profondo 2.0 in grado di (i) gestire e identificare la struttura del linguaggio, (ii) essere interpretabili dagli esseri umani e (iii) che siano efficienti dal punto di vista dei dati, anche per le lingue con risorse limitate. Con questi elementi possiamo davvero fare un salto di qualità verso la soluzione del problema della comunicazione multilingue!


Il progetto sarà realizzato in collaborazione con Unbabel, l’ Instituto de Telecomunicações, e l’Università di Lisbonae l’Instituto Superior Técnico (IST).

Se sei interessato a candidarti per prendere parte al progetto, leggi la descrizione completa del progetto. qui.

ArtboardFacebook iconInstagram iconLinkedIn iconUnbabel BlogTwitter iconYouTube icon