La construcción de la capa de traducciones mundial es una misión fantástica. Para nosotros, significa convertirse en un servicio transversal y omnipresente que pueda eliminar las barreras de la comunicación desde cualquier lugar, en cualquier momento, utilizando una combinación de tecnologías de inteligencia artificial (la traducción automática y una variedad de mecanismos de aprendizaje automático) y una creciente comunidad global de personas bilingües.  

Esto también significa la recogida, procesamiento y distribución de una cantidad masiva de datos por segundo, garantizando al mismo tiempo que se cumplan los estándares de calidad y velocidad de nuestros clientes. 

Si no estás familiarizado con la forma de trabajar de Unbabel, puedes leer sobre ello en profundidad aquí, pero también tienes un resumen aquí: 

translation pipeline

  1. Un trabajo detraducción se solicita a través de nuestra API o por medio de integraciones con plataformas como Salesforce y Zendesk);
  2. Nuestra cartera de traducción impulsado por la IA recogerá la traducción, enviándola para su traducción automática a través de un motor que se ha personalizado por tipos de contenido y, a veces, por el cliente;
  3. Tan pronto como el motor de traducción automática termine, el sistema de Estimación de Calidad (EC) evaluará si la calidad de impresión es buena y, si es así, la enviará inmediatamente al sistema que lo solicita;
  4. Cuando el EC determina que se necesita intervención humana para los ajustes finales, el texto se divide en varios segmentos y se envía a nuestra comunidad;
  5. A medida que la comunidad finaliza los últimos detalles, el texto final se agrupa y se envía.

Incluso simplificada, esta es más bien una gran cantidad de partes móviles de un extremo al otro. Entonces, ¿cómo mantenemos la calidad y la velocidad con una configuración de este tipo? 

Mejora de la calidad

La IA de Unbabel evoluciona continuamente, no solo porque nuestros equipos de IA trabajan diariamente para mejorar los algoritmos existentes en el núcleo, sino también porque siguen aprendiendo de sus propios resultados y de los datos patentados que recogemos.

Un tipo de datos al que tenemos acceso son las anotaciones lingüísticas realizadas en los trabajos traducidos terminados. Un equipo global de expertos lingüistas trabajan todo el tiempo para anotar nuestras traducciones con información cualitativa y cuantitativa que nos permite trazar un mapa de lo que ya está funcionando y lo que se puede mejorar, mejorando aún más la capacidad de la tubería para producir resultados de mayor calidad, de forma coherente. 

También podemos revisar nuestros modelos de aprendizaje automático originales y actualizarlos de manera regular. Más datos significa mejores modelos, lo que significa una mejor calidad de la traducción automática. 

Automatización de la formación AI 

La clave para tener un canal de desarrollo saludable es hacer pequeños incrementos e implementar a menudo. Esta es una buena práctica general y se puede encontrar en cualquier libro de DevOps. Tomamos este mantra un paso más allá y lo aplicamos también a nuestra formación en IA.

Automatizamos el proceso completo mediante un canal de programación autónoma que:

  1. Realiza un procedimiento ETL de almacenamiento de datos en reposo;
  2. Se ejecutan los datos a través de un proceso de anonimidad , de modo que cualquier información de identificación de datos personales o sensibles sean eliminados. No necesitamos ni queremos estos datos y eliminamos el riesgo sacándolos de donde deberían estar;
  3. Transforma y carga datos en los sistemas de formación de Unbabel, activando los sistemas de formación de UPG paralelas; 
  4. Recupera y prueba los resultados de los modelos de formación basadas en un conjunto de tests de sanidad;
  5. Actualiza los servidores de IA con nuevos modelos.

Al funcionar con una adaptación de dominio basada en el cliente y la categoría, este proceso se ejecuta para todos los modelos, asegurándose de que mantenemos nuestras máquinas de traducción automática siempre actualizadas con los datos más nuevos que podemos proporcionar.

developers deploy systems

Entrega 

Nuestra arquitectura de ingeniería de software está diseñada para mejorar sin dolor, vertical y horizontalmente. Con un modelo de micro-servicio, somos capaces de ampliar o disminuir áreas muy específicas del proceso de traducción, aumentando la eficiencia global. 

La mayoría de nuestros servidores están basados en tecnologías de contenedores y, así como es sencillo evaluar un servidor de Inteligencia Artificial, también lo es actualizar cualquier otra parte del sistema. Los micro-servicios y los contenedores van de la mano con el concepto de una arquitectura inmutable donde todas las partes no esenciales son desechables, reemplazables y actualizables en tiempo real; con las metodologías adecuadas y sin tiempo de inactividad.

Velocidad de mejora

Cuando se trata de todo lo que hemos cubierto hasta ahora, nuestros tiempos de respuesta son básicamente en tiempo real. Sin embargo, tan pronto como estas salidas se distribuyen hacia nuestra comunidad de post-editores bilingües, bien puede seguir siendo un trabajo considerable para ser hecho con el fin de lograr la calidad que nuestros clientes esperan y exigen de nosotros. 
No es que los seres humanos sean lentos traduciendo , de hecho, la mayoría de las investigaciones muestran que son mucho más rápidos en la edición posterior a la traducción automática que traduciendo desde cero pero esa comprensión del contexto, el potencial de los detalles técnicos, las ambigüedades lingüísticas y otras sensibilidades culturales siempre requerirán algún tiempo para asegurar un resultado aceptable. 

Mejora de las interfaces del usuario editor de Unbabel 

Ya sea a través de nuestra interfaz web o de nuestras aplicaciones para móviles de las dos principales plataformas, la experiencia de usuario que ofrecemos a nuestra comunidad global de más de 50.000 bilingües es una de las piezas más importantes del rompecabezas. 

Si queremos continuar hacia la mayor calidad en el menor tiempo posible, entonces necesitamos seguir mejorando, sin descanso, las herramientas para que nuestros editores puedan trabajar en tareas de traducción en cualquier momento y en cualquier lugar. 
Estamos en contacto constante con nuestra increíble y comprometida comunidad y nos enorgullecemos de escuchar y actuar en su retroalimentación. Haciendo pruebas de usuario en contra de nuestras interfaces existentes y de aquellas que estamos considerando lanzar. Midiendo sus interacciones en la plataforma para encontrar formas nuevas de mejorar aún más las cosas. Cualquier cosa que elimine la fricción y permita a nuestra comunidad hacer un trabajo mejor, más rápido y más satisfactorio es absolutamente crucial para nuestra misión. 

IA +Humanos= calidad y velocidad

Calidad y velocidad pueden ser, en ocasiones, elementos percibidos como contradictorios, y su mejora es, sin duda, un desafío tecnológico inmenso pero es la clave para nuestro éxito como empresa. 

A menudo nos preguntan, “¿no se harán traducciones usando solo la IA?”, pero décadas y miles de millones gastados en la investigación han demostrado que siempre habrá un hueco para captar plenamente la ambigüedad, idiosincrasia y paradojas del idioma humano. 

Solo mediante el desarrollo de la relación simbiótica entre la inteligencia artificial y la humana podemos construir esta capa de traducción mundial.