La mayoría de las grandes empresas como Google, Microsoft, Yahoo, Yandex, eBay y Amazon crean y entrenan sistemas de traducción automática (MT, por sus siglas en inglés) para ámbitos generales. Estos sistemas de traducción utilizan millones y millones de puntos de datos (como toda la Red informática mundial) con el objetivo de comprender mejor los contenidos online publicados en otros idiomas.

Quienes siguen de cerca el mundo de la traducción automática es muy probable que hayan leído que todos estos sistemas se han actualizado recientemente y ahora incluyen sistemas de «Traducción automática neuronal». Sin embargo, la traducción automática para un uso general sigue sin ser lo mismo que la traducción automática para los negocios.

Si bien es cierto que la calidad ha mejorado, un sistema de traducción automática para un uso general es como un pez fuera del agua cuando se utiliza para traducir textos de temas diferentes a aquellos para los que se le ha entrenado (por ejemplo, para traducir artículos de prensa, actas del parlamento, etc.). Si usamos uno de ellos para traducir correos electrónicos, conversaciones de chat con clientes internacionales o información comercial un tanto delicada, como pueden ser las descripciones de productos, pronto empezaremos a notar que nada suena natural.

Los tonos formales e informales se mezclan, los nombres de entidades se traducen mal, los términos relacionados con la marca que deberían permanecer en el idioma original aparecen en otra lengua e incluso se originan otros muchos errores que hacen que el contenido no sea adecuado para un entorno empresarial.

No hay duda de que las tecnologías de redes neuronales están mejorando considerablemente los resultados de la traducción automática (sobre todo en términos de fluidez), pero todavía existe una gran brecha entre estas tecnologías y la calidad que esperan obtener las empresas multinacionales de hoy en día.

Resultados del sistema de traducción automática adaptado de Unbabel

Para poder cumplir con los exigentes estándares del ámbito comercial, primero tenemos en cuenta las limitaciones que presenta la traducción automática y basamos nuestro flujo de trabajo en una combinación de traducción automática y editores humanos. Varios datos demuestran que si se usa un mejor sistema de traducción automática, la cantidad de posedición necesaria es menor y, por lo tanto, las traducciones se realizan de una forma más rápida y se obtiene una mejor calidad.

Maria at Unbabel

Hace poco, llevamos a cabo una serie de experimentos para comparar el sistema de traducción automática adaptado al sector comercial de Unbabel con los sistemas de traducción automática generales (tanto con traducción automática neuronal como sin ella). Para tal fin, seleccionamos 5 de las combinaciones de idiomas más populares: inglés a español, francés, portugués, italiano y alemán.

Los textos empleados para el experimento eran solicitudes de asistencia de los servicios de atención al cliente que usan las aplicaciones Unbabel para Zendesk y Unbabel para Salesforce Service Cloud. Una vez obtenidos los textos, los evaluamos mediante el método BLEU, la métrica de evaluación para sistemas de traducción automática, para conocer los resultados de nuestro sistema de traducción automática:

Como se puede comprobar, la traducción automática adaptada de Unbabel logra unas puntuaciones elevadas en todos los casos, a veces de forma bastante considerable. Esto confirma nuestra hipótesis de que entrenar a nuestro sistema a partir de los datos de los clientes es algo sumamente útil. Para la comunidad científica este hecho no es ninguna novedad, pero puede serlo para muchas personas del mundo de los negocios.

Tampoco hay que olvidar la función para crear glosarios de Unbabel, la cual permite calibrar nuestros sistemas de traducción para adaptarlos a cada cliente y, de este modo, asegurar que se tengan en cuenta las guías de estilo, la terminología de la marca y otros metadatos. Un ejemplo bastante ilustrativo sobre esta función es el de Pinterest, que que cuando aparezca la palabra «Pin» prefieren que no se traduzca por «Alfiler» en español.

De todos modos, hay que recordar que este es solo el primer paso para realizar las traducciones que nuestros clientes necesitan. En Unbabel creemos firmemente que el «problema de la traducción» solo se puede resolver mediante la fusión de la inteligencia artificial y el esfuerzo humano.

André and Ramon at Unbabel

Después de que la máquina ya haya hecho su trabajo, el siguiente paso es distribuir estos textos, divididos en lotes creados de forma inteligente, entre nuestros 45 000 lingüistas, que trabajan a través de sus dispositivos móviles. Ellos son los que se encargan de editar el contenido y darle la calidad humana que nuestros clientes esperan. Trataremos ese tema en las próximas entradas.


Agradecimientos:

André Martins, director de investigación de Unbabel, dirigió los experimentos con la ayuda de Maria Braga y Catarina Cruz Silva.

Notas:

  • Para realizar los experimentos, aplicamos una serie de medidas básicas para evitar errores comunes. De este modo, nos aseguramos de que ningún par de frases del conjunto de datos se solapara con el modelo de entrenamiento para nuestro sistema de traducción automática
  • Nuestra comparación favorece ligeramente al sistema de traducción de Google, ya que las traducciones de referencia usados de los experimentos se obtuvieron a partir de la posedición humana del traductor de Google (de ahí el asterisco)
  • No hemos incluido en el informe el sistema de traducción automática neuronal de Google para italiano, ya que actualmente no está incluido en su API premium.