Construir o estrato da tradução do mundo é uma missão fantástica. Para nós, isso significa tornarmo-nos num serviço transversal e penetrante, que pode remover as barreiras da comunicação em qualquer lugar, a qualquer hora, usando uma combinação de tecnologias de inteligência artificial (tradução automática e uma variedade de mecanismos de aprendizagem automática) e uma crescente comunidade global de bilingues. 

Isto também implica recolher, processar e distribuir uma enorme quantidade de dados por segundo, garantindo, simultaneamente, o cumprimento das normas dos nossos clientes em termos de qualidade e velocidade. 
Se não estás familiarizado com o modo de funcionamento da Unbabel, podes ler sobre o assunto, de forma bastante pormenorizada aqui, mas fica aqui um resumo:

translation pipeline

  1. Um trabalho de tradução é solicitado através da nossa API, ou através de parcerias com plataformas como Salesforce e Zendesk;
  2. A nossa linha de tradução potencializada por IA vai selecionar o trabalho, enviando-o para a tradução automática, através de um motor que foi personalizado por tipos de conteúdo e, por vezes, pelo cliente;
  3. Assim que o motor de tradução automática terminar, o sistema de Estimativa de Qualidade (QE) vai avaliar se a qualidade dos resultados é adequada. Se assim for, o trabalho é imediatamente expedido e enviado para o sistema que o solicitou;
  4. Quando o QE determina que é necessário um ser humano para os ajustes finais, o texto é dividido em vários pedaços e enviado para a nossa comunidade;
  5. Quando a comunidade terminar os últimos ajustes, o texto final é reagrupado e enviado em conformidade.

Mesmo simplificado, é um sistema que envolve um considerável número de etapas, desde o início até ao fim. Então, como vamos dimensionar a qualidade e a velocidade com tal configuração?

Dimensionar a qualidade

A IA da Unbabel evolui continuamente, não só porque as nossas equipas de IA trabalham diariamente para melhorar os algoritmos existentes na sua essência, mas também porque ela continua a aprender com os seus próprios resultados e dados de propriedade que vamos reunindo.

Um tipo de dados aos quais temos acesso são as anotações linguísticas feitas sobre o trabalho que temos traduzido. Uma equipa global de linguistas especializados trabalha incessantemente para anotar informações qualitativas e quantitativas nas nossas traduções, que nos permitem identificar o que já está a funcionar e o que pode ser melhorado, aumentando ainda mais a capacidade geral da linha de tradução de produzir resultados com mais qualidade, de uma forma consistente. 

Podemos também rever os nossos modelos originais de aprendizagem automática e atualizá-los regularmente. Mais dados significam melhores modelos, o que significa melhor qualidade na tradução automática. 

Formação automática na IA  

A chave para ter uma linha de desenvolvimento saudável é fazer pequenos incrementos e implementá-los com frequência. Esta é uma prática geral recomendada e pode ser encontrada em qualquer livro sobre DevOps. Levamos este mantra ainda mais longe e aplicamo-lo também à nossa formação de IA.

Nós automatizamos o processo completo, ao termos uma linha de programação autónoma que:

  1. executa um processo ETL, a partir do armazenamento de dados;
  2. executa dados através de um processo de anonimização de modo a que alguma informação de identificação pessoal ou dados de natureza sensível sejam removidos; nós não precisamos, nem queremos, esses dados e removemos o risco de eles irem para onde não devem estar;
  3. transforma e carrega dados para os sistemas de formação da Unbabel, ativando sistemas de formação paralelos baseados em GPU;
  4. recupera e testa os resultados dos modelos de formação, com base num pacote de testes de sanidade;
  5. atualiza os servidores da IA com os novos modelos.

Desde que fornecemos adaptações de domínio baseados no cliente e na categoria, este processo é executável em todos os modelos, certificando-nos de que mantemos a nossa tradução automática sempre atualizada e sujeita a atualizações constantes.

developers deploy systems

Entrega 

A arquitetura do nosso software de engenharia é elaborada para dimensionar fácil, vertical e horizontalmente. Com um modelo de micro serviços, conseguimos ampliar ou reduzir áreas muito específicas da linha de tradução, aumentando a eficiência geral. 
A maioria dos nossos servidores baseia-se em tecnologias de confinamento e, como tal, atualizar um servidor de IA é tão fácil como atualizar qualquer outra parte do sistema. Os micro serviços e as caixas de texto andam de mãos dadas com o conceito de uma arquitetura imutável, onde todas as partes apátridas são descartáveis, substituíveis e atualizáveis em tempo real e, com as metodologias adequadas, sem tempo de inatividade.

Dimensionar a velocidade

Em relação a tudo aquilo que tratámos até agora, os nossos tempos de resposta ocorrem essencialmente em tempo real. No entanto, quando estes resultados são distribuídos pela nossa comunidade de pós-editores bilingues, ainda pode haver muito trabalho a fazer para atingir a qualidade que os nossos clientes esperam e exigem de nós. 

Não é que os seres humanos sejam lentos a traduzir, de facto, a maioria das pesquisas mostra que eles são muitas vezes mais rápidos na pós-edição da tradução automática, do que quando traduzem o trabalho desde o início, mas que a compreensão do contexto, de potenciais detalhes técnicos, de ambiguidades linguísticas e de outras sensibilidades culturais irá sempre exigir algum tempo para garantir um resultado aceitável. 

Melhorar as interfaces de utilizador dos editores da Unbabel 

Quer se trate da nossa interface da Web ou de aplicações móveis das duas plataformas principais, a experiência de utilizador que oferecemos à nossa comunidade global de mais de 50.000 bilingues é uma das peças mais importantes do puzzle. 

Se quisermos continuar a dimensionar, mantendo a alta qualidade no menor tempo possível, então precisamos de melhorar incansavelmente as ferramentas, para que os nossos editores possam trabalhar em tarefas de tradução a qualquer hora, em qualquer lugar. 

Estamos em contacto constante com a nossa incrível e empenhada comunidade e temos orgulho em ouvi-la e agir de acordo com o seu feedback, ao aplicarmos testes na perspetiva do utilizador relativamente às interfaces já existentes, bem como àquelas que estamos a considerar implementar e medindo as suas interações na plataforma, para encontrar novas formas de melhorar ainda mais a experiência. Tudo o que possa eliminar o atrito e permita que a nossa comunidade faça um melhor trabalho, mais rápido e com maior satisfação é absolutamente crucial para a nossa missão. 

IA +Humano = qualidade e velocidade dimensionada

A qualidade e a velocidade podem, por vezes, ser entendidas como escolhas contraditórias e conseguir os dois é, de facto, um grande desafio tecnológico, mas é a chave para o nosso sucesso enquanto empresa. 

Perguntam-nos, muitas vezes, se a tradução não vai ser resolvida apenas com a IA, mas, após décadas de pesquisa e de milhões terem sido gastos, tem-se percebido que haverá sempre uma lacuna no entendimento das ambiguidades, das idiossincrasias e dos paradoxos do idioma humano. 

Só nutrindo a relação simbiótica entre a inteligência artificial e a humana, poderemos construir o estrato de tradução do mundo.