L’altro giorno ero al telefono con mia nonna quando mi ha detto: “Non so cosa fai per vivere, ma mi va bene qualunque cosa sia purché tu sia felice.”

Di questi tempi, spiegare a tua nonna cosa fai per vivere può essere complicato. Ci sono lavori che hanno ancora definizioni abbastanza semplici: se sei un architetto, progetti case; se sei un ingegnere, le costruisci. Ma ci sono anche diversi ruoli legati alla tecnologia che sono difficili da afferrare per chi non vi è cresciuto attorno. Per mia nonna è facile capire che il mio lavoro prevede un po’ di scrittura, ma lei non comprende il “lato internet” delle cose, per non parlare della linea di business di Unbabel.

Quando chiesi a Yoav Goldberg, docente senior presso il Dipartimento di Informatica della Bar Ilan University, come avrebbe spiegato il suo lavoro a sua nonna, mi aspettavo che non riuscisse a trovare una spiegazione che fosse abbastanza facile da capire per la gente comune. Invece, ne venne fuori dicendo semplicemente che il suo lavoro consiste nel “fare in modo che i computer facciano qualcosa di semi-intelligente con la lingua, che suggerisca un certo livello di comprensione”.

Ma cosa fa esattamente un docente senior di informatica ogni giorno?

Yoav Goldberg è solito dividere il suo tempo tra due diverse linee di lavoro. La prima è cercare di capire in che modo i modelli di deep learning apprendano le cose e cosa possono o non possono imparare, il che per lui è un problema importante poiché “nessuno capisce davvero cosa sta succedendo”. La seconda linea di lavoro è capire come creare componenti o strumenti di NLP (Natural Language Processing, Elaborazione del Linguaggio Naturale) che siano utili per le persone e le aziende il cui core business non è l’NLP e che non sono esperte nel settore, ma che hanno comunque bisogno di questi strumenti per elaborare in qualche modo il linguaggio.

Anche se è interessato all’applicazione dell’NLP nel mondo degli affari, ritiene che, in generale, vi sia una scissione tra università e industria. La prima tende a concentrarsi sull’identificazione e la risoluzione di nuovi problemi, mentre la seconda mira a mettere in pratica questi risultati. In alcuni casi, è possibile prendere la ricerca accademica e applicarla a diversi settori, ma Yoav Goldberg spiega che pochissima di quella ricerca si sviluppa divenendo un prodotto.

Penso che, da un punto di vista accademico, non ci concentriamo abbastanza su cose su cui occorrerebbe concentrarsi, come valori o altre metriche facili da ottimizzare, ma che sono alquanto disconnesse da ciò che si desidera realmente.

Nonostante non sia direttamente il suo campo di ricerca, Goldberg ritiene che la traduzione automatica sia probabilmente la migliore tecnologia disponibile in questo momento, che è correlata alle sue ricerche sull’NLP. È quella che funziona meglio e che vediamo più frequentemente applicata alle imprese. Il motivo è, secondo lui, che è possibile fare molto con la lingua senza comprenderla per intero. Si tratta semplicemente di trasformare un input in una lingua in un output in una lingua diversa. Non devi capire cosa sta nel mezzo.

Ciò permette di ottenere facilmente, con la traduzione automatica, risultati abbastanza buoni da essere utili. Ma è quando questa fallisce che è necessario intervenire per capire il perché. In un articolo scritto nel 2017, Yoav Goldberg ha affermato di avere un grande rispetto per la lingua, al contrario delle “persone del deep learning che sembrano non averlo”. A suo avviso, i ricercatori in questo campo affermavano di aver risolto problemi di lingua, sebbene non l’avessero chiaramente fatto.

Hanno dato l’impressione che a loro non importasse molto di come fossero i dati. Dovevi solo fare due conti, senza bisogno di cogliere le sottigliezze del linguaggio.

Una di queste sottigliezze è il contesto. Ad esempio, se leggi su un giornale qualcosa come “se i prezzi salgono, allora succederà qualcosa”, non saranno i prezzi in generale a salire, ma piuttosto i prezzi di qualcosa che forse è stato espresso nel titolo o da qualche altra parte nel testo. In questa frase specifica non è chiaro, ma tutti coloro che lo leggono capiscono di cosa si tratti. Le macchine no.

Yoav Goldberg sta attualmente conducendo ricerche per risolvere questo problema. È molto stimolante perché ci sono molti modi in cui le persone omettono informazioni mentre parlano o scrivono. Facendo un altro esempio, si può dire: “No, ne ho già cinque”. Sono cinque le cose che chi parla già aveva, ma manca il sostantivo dopo il numero. Il modo in cui i ricercatori affrontano la questione è isolando diversi contesti e lavorando su ciascuno di essi separatamente. Il team di Goldberg ha sviluppato un sistema che è già in grado di dedurre relativamente bene questo tipo di contesto, ma ci sono molti altri contesti da considerare e su cui lavorare.

Riflettendo sul futuro della ricerca e dell’applicazione dell’NLP, Yoav Goldberg afferma che probabilmente useremo ancora le reti neurali tra cinque o anche dieci anni. Funzionano bene e al momento non esiste una tecnologia migliore. Tuttavia, c’è un problema frequente nelle reti neurali: funzionano quando hai abbastanza dati e non funzionano quando non hai abbastanza dati.

Per i domini per i quali semplicemente non ci sono abbastanza dati disponibili, siamo al punto in cui occorre cercare di farli funzionare con meno dati e pochissimi esempi, provando a generalizzarli per far funzionare bene i sistemi. Questa è una tendenza che i ricercatori continueranno probabilmente a seguire negli anni a venire.

Per quanto riguarda la traduzione automatica, Yoav Goldberg ritiene che gli umani non usciranno mai del tutto dal processo, soprattutto perché i sistemi neurali non sanno ancora se stanno commettendo errori o meno. Semplicemente, non capiscono la lingua come lo fanno le persone.

Ma neanche Yoav Goldberg è interessato a farglielo capire.

Non sono guidato dalla ricerca dell’intelligenza, ma piuttosto da domande come “Come è strutturata una lingua e come facciamo a farci cose utili?”

Queste sono le domande che lo hanno guidato durante i 20 anni di carriera: domande che non si sarebbe mai aspettato di porsi da bambino, che da grande voleva diventare un mago o un supereroe. Giocava a molti videogiochi ed era sempre curioso di sapere come digitare un comando per innescare qualcosa. Dice anche che ha sempre nutrito interesse per la lingua fino ad un certo punto.

Forse la figura di mago, supereroe o persino di star della reality TV (qualche anno fa ha avuto la possibilità di partecipare alla versione israeliana di Beauty and the Geek, ma ha rifiutato l’invito) sarebbe più facile da spiegare a un parente più anziano, ma, stranamente, ha più senso essere “docente senior in informatica”.