El otro día estaba hablando por teléfono con mi abuela cuando me dijo: “No sé a qué te dedicas, pero lo que sea me parece bien mientras seas feliz”.

En estos tiempos, explicarle a tu abuela a qué te dedicas puede resultar complicado. Hay trabajos que todavía tienen definiciones bastante simples: si eres arquitecto, diseñas casas; si eres ingeniero, las construyes. Pero también hay una serie de roles relacionados con la tecnología que son difíciles de entender para alguien que no se crió entre ellos. Para mi abuela es fácil entender que mi trabajo implica escribir algo, pero no entiende esa parte de las cosas que implica Internet y, mucho menos, cuál es la línea de actividad de Unbabel.

Cuando le pregunté a Yoav Goldberg, profesor titular del Departamento de Informática de la Universidad de Bar Ilan, cómo le explicaría su trabajo a su abuela, esperaba que tuviera dificultades para encontrar una explicación que fuera lo suficientemente fácil de entender para la persona común. Sin embargo, expresó de manera bastante simple que su trabajo consiste en “hacer que los ordenadores hagan algo semi-inteligente con un lenguaje que insinúa que se logró cierta comprensión”.

Pero, ¿qué es lo que hace exactamente un profesor titular de informática a diario?

Yoav Goldberg ha estado dividiendo su tiempo entre dos líneas de trabajo diferentes. La primera intenta entender cómo los modelos de aprendizaje profundos aprenden cosas y qué pueden o no pueden aprender, lo cual para él es un tema importante ya que “nadie entiende realmente lo que está sucediendo”. La segunda línea de trabajo intenta descubrir cómo crear componentes naturales de procesamiento de lenguaje o herramientas que serán útiles para personas y empresas cuyo negocio principal no es la PNL y que no son expertos en el campo, pero que aún necesitan esas herramientas para, de alguna manera, procesar el lenguaje.

Aunque él esté interesado en la aplicación de la PNL en las empresas, siente que, en general, hay una desconexión entre la academia y la industria. La primera tiende a centrarse en identificar y resolver nuevos problemas, mientras que la segunda quiere poner en práctica esos resultados. En algunos casos, es posible realizar investigaciones académicas y aplicarlas en diferentes industrias, pero Yoav Goldberg explica que no mucha de esa investigación se desarrolla en un producto.

Creo que desde una perspectiva académica, no nos enfocamos lo suficiente en las cosas que realmente necesitan atención, como valores u otras métricas que resultan fáciles de optimizar pero que están realmente desconectadas de lo que realmente quieres.

A pesar de no ser directamente su campo de investigación, Goldberg cree que la traducción automática es probablemente la mejor tecnología que hay en la actualidad relacionada con sus investigaciones en PNL. Es la que funciona mejor y la que con mayor frecuencia vemos aplicada en las empresas. La razón de esto es, en su opinión, que es posible hacer mucho con el lenguaje sin comprenderlo en su totalidad. Es simplemente cuestión de convertir una entrada de un idioma en una salida de un idioma diferente. No tienes que entender lo que hay en el medio.

Esto facilita que la traducción automática funcione lo suficientemente bien como para ser útil. Pero cuando falla es necesario intervenir para entender por qué. En un artículo que escribió en 2017, Yoav Goldberg afirmó tener mucho respeto por el lenguaje, al contrario que “las personas de aprendizaje profundo que parecen no tenerlo”. Tal como él lo veía, los investigadores en este campo afirmaron haber resuelto problemas del lenguaje y, en realidad, no lo habían hecho.

Daban la impresión de que realmente no les importaba cómo eran los datos. Solo tenías que introducir algunos números, sin apreciar realmente las sutilezas del lenguaje.

Una de estas sutilezas es el contexto. Por ejemplo, si lees en un periódico algo como “si los precios suben, entonces algo sucederá”, no subirán los precios en general, sino los precios de algo que tal vez se exprese en el título o en alguna otra parte del texto. En esta oración específica no está claro, pero todos los que lo leen lo entienden. Las máquinas no.

Actualmente Yoav Goldberg lidera la investigación para resolver este problema. Resulta un gran desafío porque hay muchas formas en las que las personas omiten información mientras hablan o escriben. Otro ejemplo es decir: “No gracias, ya he tomado cinco”. El hablante ha tomado cinco de algo antes, pero falta el nombre después del número. La forma en que los investigadores se enfrentan a esta cuestión es aislando diferentes contextos y trabajando en cada uno de ellos por separado. El equipo de Goldberg ha desarrollado un sistema que ya puede inferir este tipo de contexto relativamente bien, pero hay muchos otros contextos que considerar y en los que trabajar.

Al reflexionar sobre el futuro de la investigación y la aplicación de la PNL, Yoav Goldberg dice que probablemente todavía usaremos redes neuronales dentro de cinco o incluso diez años. Funcionan bien y no hay mejor tecnología disponible en este momento. Sin embargo, hay un problema frecuente en las redes neuronales: funcionan cuando tienes suficientes datos y no funcionan cuando no tienes suficientes datos.

Para los dominios en los que simplemente no hay suficientes datos disponibles, estamos en un punto en el que se trata de hacer que funcionen con menos datos y con muy pocos ejemplos, pero aún así intentar generalizarlos para que los sistemas funcionen bien. Es una tendencia que los investigadores probablemente seguirán en los próximos años.

En cuanto a la traducción automática, Yoav Goldberg no cree que los humanos estén completamente fuera de escena, principalmente porque los sistemas neuronales todavía no saben si cometen errores. Simplemente no entienden el lenguaje como lo hacen los humanos.

Pero Yoav Goldberg tampoco está interesado en hacerles entender.

No me motiva la búsqueda de inteligencia, sino preguntas del tipo “¿cómo está estructurado el lenguaje y cómo podemos hacer cosas útiles con él?”

Estas son las preguntas que lo han guiado a lo largo de sus 20 años de carrera: preguntas que no vio venir cuando era niño y de mayor quería ser mago o superhéroe. Jugó a muchos videojuegos y siempre sintió curiosidad por saber cómo escribir un comando para hacer que las cosas sucedan. También dice que siempre se ha preocupado por el lenguaje hasta cierto punto.

Tal vez si fuese mago, superhéroe o incluso estrella de un “reality show” (hace unos años tuvo la oportunidad de participar en la versión israelí de “Beauty and the Geek” pero rechazó la invitación), sería más fácil explicárselo a un pariente mayor, pero de alguna forma “profesor titular en informática” tiene más sentido.