Cómo el sistema de traducción de idiomas empleado por Unbabel conseguirá traducirlo todo con calidad humana

10 min read
Unbabel Translation

En el mercado de los servicios de traducción y localización, que genera 38 000 millones de dólares anuales , el principal protagonista es un contratista militar que factura 730 millones de dólares al año. El resto de los diez mejores facturan entre 80 y 430 millones de dólares al año.

Es un mercado muy fragmentado, con una larga cola de empresas que operan modelos de negocio muy similares, «marketplaces» que ponen en contacto a clientes con grandes grupos de traductores profesionales que hacen ofertas para conseguir los trabajos en función de sus habilidades, su experiencia y sus tarifas. Una vez que el cliente acepta su oferta, el traductor trabaja de forma individual en un contenido concreto. ¿Necesitas más idiomas? Contrata a más traductores.

Así es como las cosas han funcionado siempre. Pero la historia reciente ha demostrado que lo que no es escalable no es sostenible. Y que si encuentras una nueva forma de hacer las cosas, se te abrirán nuevos mercados con un potencial enorme e inexplorado.

Translation Market

Para Unbabel, la traducción tal como existe actualmente es parte del problema.

¿Cómo se puede traducir todo?

¿Qué pasa si quieres traducir toda la información del mundo a todos los idiomas y quieres hacerlo de forma casi instantánea? No solo documentos legales, términos y condiciones o catálogos de productos, sino todos los correos electrónicos, todas las conversaciones de chat, todos los subtítulos y, en definitiva, todo el contenido que puedas imaginarte.

Para afrontar el reto, es necesario replantearse el funcionamiento de los sistemas de traducción. El problema no está en la falta de personal, sino en el software. Este debe ser capaz de definir un proceso y mejorarlo de forma continua para obtener unos resultados cada vez mejores.

Algunas empresas tecnológicas ya ven el mundo de esta manera, pero no son capaces de darse cuenta de las dificultades con las que se encuentran la mayoría de las empresas y organizaciones para salvar el enorme abismo entre la traducción automática más avanzada y la que se hace «a la antigua», es decir, por seres humanos.

Para que se las tome en serio, las empresas modernas necesitan una solución que comprenda el contexto, el tono, el estilo y el matiz de un texto y que pueda detectar los errores que se pasan por alto en las traducciones completamente automáticas.

Zapateros frente a sistemas de producción de zapatos

Para comprender lo que Unbabel está haciendo en el campo de la traducción, piensa en cómo se fabricaba el calzado en el siglo XVIII.

Hasta ese momento, los zapatos siempre se habían hecho a mano, uno por uno. Al fabricarse a una escala tan pequeña, se empleaba una gran cantidad de tiempo y de energía en hacer cada par, de forma que solo un pequeño porcentaje de la población podía permitirse adquirir este producto.

Pero a mediados del siglo XVIII, el calzado empezó a fabricarse a una escala nunca antes vista. La fabricación artesanal dio paso al mundo industrializado, con miles de zapateros afanándose para intentar cubrir la demanda (como la larga cola de agencias de traducción mencionada anteriormente).

Las Guerras Napoleónicas supusieron un empuje en la mecanización del proceso de producción, ya que el famoso ingeniero inglés Marc Brunel desarrolló maquinaria para la producción en serie de botas para los soldados del Ejército británico. Un visitante de su fábrica en Battersea escribió lo siguiente:

«Cada etapa del proceso se lleva a cabo por la maquinaria más elegante y precisa. Todos los detalles son ejecutados por la ingeniosa aplicación de las potencias mecánicas, y todas las piezas se caracterizan por su precisión, su uniformidad y su exactitud. Como cada persona lleva a cabo un solo paso del proceso, no es necesario que conozcan las etapas anteriores ni posteriores. De esta forma, las personas empleadas, que no son zapateros, sino soldados heridos, son capaces de aprender sus respectivas funciones en unas pocas horas».

Si se quieren eliminar por completo las barreras lingüísticas y que todo el mundo pueda entender y ser entendido en cualquier idioma y a través de cualquier medio, es necesario abstraer el problema de la traducción a un nivel mucho más alto que el de «contratar a más gente».

Es necesario dividir el proceso en una serie de pasos precisos, uniformes y exactos que puedan llevarse a cabo por máquinas guiadas por humanos en puntos clave, y no necesariamente por los expertos que anteriormente realizaban íntegramente este trabajo.

Algo parecido a la fábrica de zapatos de Brunel.

El canal de traducción de idiomas de Unbabel

Lo que garantiza la calidad en Unbabel no es la calidad individual de cada uno de los traductores, que incluso a un nivel profesional puede variar enormemente y son propensos a cometer errores humanos (porque, evidentemente, son humanos), sino la calidad del proceso que se sigue para obtener el resultado final y que consta de una serie de pasos específicos, uniformes y precisos.

El trabajo humano sigue siendo necesario, pero en momentos que no son decisivos, para corregir y editar el trabajo de una maquina en lugar de tener que afrontar el trabajo completo. Esto elimina la dependencia del trabajo humano, pero aumenta enormemente su valor al centrarlo principalmente en las correcciones de calidad. Además, hace que el proceso sea mucho más rápido.

A nivel general, Unbabel recibe un texto en el idioma de origen y lo envía a los clientes en uno o varios de los 27 idiomas de destino disponibles.

A un nivel más específico, hay una serie de pasos que ocurren entre A y B.

Translation Pipeline

Pedido

Un pedido es un fragmento de texto que debe traducirse. Puede ser un correo electrónico de atención al cliente de una plataforma como Salesforce, Zendesk o Freshdesk, una descripción de un producto de una plataforma de comercio electrónico internacional o subtítulos de vídeo.

Cada tipo de contenido tendrá su propio recorrido personalizado a través del canal, con diferentes prioridades en función de aspectos como la calidad y la velocidad, aunque el proceso general es el mismo para todos los textos.

Preparación

En esta fase, Unbabel analiza el texto origen, detectando y determinando una serie de factores que influirán en el camino que va a seguir este texto a lo largo de todo el proceso.

En primer lugar, se adoptan una serie de medidas en función del cliente de Unbabel del que procede el texto. Los glosarios personalizados y las guías de estilo que forman parte del proceso de incorporación se integran de forma automática en los pedidos, y la información sensible, como los números de tarjetas de crédito, se encripta para mantener el anonimato.

Se realizan análisis precisos del texto en el idioma original para detectar elementos difíciles de traducir como lugares, nombres y direcciones, y se estima la dificultad general del texto en función del vocabulario utilizado, la longitud de las oraciones y otros patrones gramaticales.

Se construye un modelo con estos datos y otros referentes al tono del documento (formal o informal) y al tema del que trata, lo que permite la asignación inteligente del contenido a un editor determinado en función de sus intereses (viajes, deportes, medicina o entretenimiento, entre otros).

Traducción automática adaptada de Unbabel

Adapted Machine Translation

Una vez que ha tenido lugar la preparación, el primer trabajo de traducción se lleva a cabo íntegramente por una máquina. Para empezar, Unbabel comprueba su memoria de traducción , un almacén de datos enorme y dinámico gracias al cual se pueden recuperar y reutilizar las oraciones que ya se han entregado a ese mismo cliente o a ese mismo dominio anteriormente, lo cual permite una mejora potencial en la velocidad de entrega y en la consistencia de la traducción (aunque los editores humanos pueden efectuar modificaciones después si el contexto es incorrecto).

El siguiente paso es a través del sistema de traducción automática
, que elige los mejores motores especializados de traducción automática en función del contenido, el dominio y el cliente (un correo electrónico de un cliente tiene unas características distintas a las de la descripción de un reloj de lujo hecho a mano).

El contenido traducido de esta forma se dirige a continuación al poseditor automático, gracias al cual Unbabel mejora las traducciones de forma automática según lo que ha aprendido de lo que los editores han hecho anteriormente. Esto genera una nueva versión cuya calidad ha de ser evaluada (usando nuestro sistema de estimación de calidad galardonado ). Para ello se envía a las personas adecuadas dentro de la comunidad de Unbabel.

Selección del editor

Editor Selection

Unbabel cuenta con una comunidad internacional de 50 000 personas que tienen la tarea de revisar los resultados de esta traducción automática adaptada. ¿Pero cómo saber a qué editor asignar cada tarea?

Hay varios criterios para la elección del editor, pero los principales se resumen en: quién está disponible, quién está mejor calificado para cada tipo de contenido y cuál es la urgencia de cada una de las tareas que han de completarse.

Se determina la prioridad de cada tarea en función del acuerdo de nivel de servicio de ese cliente y de otros factores, y se coloca en una cola verde o en una cola roja. Todas las tareas se colocan en primer lugar en la cola verde. En un mundo ideal no existiría la cola roja, pero existe por motivos de copias de seguridad y redundancia, asegurando así el cumplimiento de los plazos.

Smart editor selection

Además, hemos realizado pruebas que demuestran que los editores a los que se asignan contenidos por los que muestran interés obtienen mejores resultados.

Smartcheck

Smartcheck

Una vez que las tareas se han asignado a las personas adecuadas, Unbabel facilita que dichas tareas se lleven a cabo de la mejor forma posible y en el menor tiempo posible.

El Smartcheck de Unbabel es como una versión mejorada de la corrección gramatical que se encuentra en los editores de texto más populares. Comprueba una serie de posibles errores y ofrece sugerencias para hacer correcciones en un solo clic con respecto a la ortografía, el tono, la coherencia léxica (que el sujeto y el verbo concuerden, que los pronombres sean los adecuados, que el género sea correcto, etc.), además de otras reglas más específicas relacionadas con los requisitos del cliente.

Es poco eficiente hacer que cada editor lea la guía de estilo de cada cliente, por lo que Smartcheck ofrece consejos de forma automática a lo largo de todo el texto, facilitando y haciendo que sea más rápida la corrección de errores no gramaticales como los matices subjetivos u objetivos de los tiempos verbales o la preferencia de escribir los números con palabras en lugar de con dígitos.

Red de autoaprendizaje de Unbabel

Network

La magia de todo este proceso es que cuanto más traduce Unbabel, mejores son sus resultados. Los sistemas de traducción automática se pueden volver a entrenar, las memorias de traducción pueden agrandarse y la posedición automática mejora con cada nuevo texto.

Cuanto más información pasa por este sistema, más mejoran sus resultados.

Empresas internacionales como Pinterest, Skyscanner, Under Armour, Trello y Oculus VR confían en la plataforma empresarial de Unbabel para abrirse camino y crecer en nuevos mercados.

Para programar una demostración, contacta con nosotros hoy mismo..

ArtboardFacebook iconInstagram iconLinkedIn iconUnbabel BlogTwitter iconYouTube icon