Saiba como a plataforma linguística da Unbabel consegue traduzir tudo com qualidade humana

10 min read
Unbabel Translation

Num mercado de serviços de tradução e localização avaliado em cerca de 38 mil milhões de dólares por ano,a maior fatia cabe a uma empresa do setor militar que fatura cerca de 730 milhões de dólares por ano. As restantes empresas do Top 10 faturam entre 80 e 430 milhões de dólares por ano.

É um mercado extremamente fragmentado, com inúmeras empresas a explorar modelos de negócio muito semelhantes: de um lado, as centrais que processam os pedidos dos clientes; do outro, grandes quantidades de tradutores profissionais que competem entre si com base nas suas competências, experiência e preços. Assim que o trabalho é adjudicado, cada tradutor trata de uma parte do conteúdo de cada vez. Precisa de mais línguas? Contrate mais tradutores.

As coisas sempre funcionaram assim. Mas a história mais recente demonstra que o que não é “personalizável”, não é sustentável. E também que basta descobrir uma nova forma de fazer as coisas para abrir novos mercados – mercados enormes, com grande potencial, à espera de serem explorados.

Translation Market

Para a Unbabel, o processo de tradução, tal como ele existe atualmente, é parte do problema.

Como é possível traduzir tudo?

E se quiser traduzir toda a informação do mundo, para todas as línguas, de forma quase instantânea? Não só documentos legais, condições contratuais e catálogos de produtos, mas todos os e-mails, todas as conversas on-line, todas as legendas, todo o conteúdo que se possa imaginar?

Para responder a este desafio, é necessário repensar todo o processo de tradução. Não como uma questão cuja solução passe por contratar mais tradutores, mas como um problema de software no qual seja possível definir e melhorar continuamente um processo de trabalho com o objetivo de produzir melhores resultados.

Algumas empresas de tecnologia já veem o mundo nesta perspetiva. No entanto, estas empresas não compreendem que para a maioria das empresas e organizações é necessário colmatar o fosso que existe entre a tradução automática mais avançada e o trabalho de tradução que parece ter sido feito “à moda antiga” – ou seja, por um ser humano.

Para serem levadas a sério, as empresas modernas precisam de uma solução que consiga não só compreender todo o contexto (o tom, o estilo e o subtexto) mas também detetar os erros que passam despercebidos na pressa de automatizar todo o processo.

Perceber a diferença entre sapateiros e a produção de calçado

Usemos o exemplo da indústria do calçado no séc. XVIII para melhor compreender o que a Unbabel está a fazer no campo da tradução.

Ao longo da história da humanidade, os sapatos sempre foram feitos à mão, um de cada vez. Numa escala tão reduzida, cada par de sapatos
era criado para o respetivo proprietário com grande dispêndio de tempo e energia, razão pela qual apenas uma pequena percentagem da população podia recorrer a este serviço.

No entanto, em meados do séc. XVIII, a indústria do calçado começou a crescer de forma nunca vista. A indústria artesanal sofreu uma transformação radical para servir a população do mundo proto-industrial, forçando milhares de sapateiros a trabalharem de sol a sol para conseguirem satisfazer a procura (tal com as inúmeras agências de tradução a que aludimos anteriormente).

As Guerras Napoleónicas deram um contributo decisivo para a mecanização do processo produtivo, cabendo ao célebre engenheiro inglês Marc Brunel a tarefa de criar máquinas que assegurassem a produção – a uma escala industrial – de botas para os soldados do exército britânico. Um observador que visitou a sua fábrica em Battersea escreveu o seguinte:

“Cada etapa é realizada pela maquinaria mais elegante e precisa… todos os pormenores são executados através de uma aplicação engenhosa das leis mecânicas; e todos os elementos caracterizam-se pela precisão e pela uniformidade. Cada funcionário executa apenas uma etapa do processo, o que não implica qualquer conhecimento das tarefas de quem o antecedeu ou sucederá; e os homens que aqui trabalham não são sapateiros mas soldados feridos que aprendem as suas funções em poucas horas”.

Se quisermos derrubar todas as barreiras linguísticas, se quisermos que todos compreendam e sejam compreendidos em qualquer língua ou suporte, é necessário colocar o problema da tradução a um nível muito mais abstrato do que a tradicional solução de contratar mais pessoas.

É necessário dividir o processo em várias etapas, executadas de forma precisa e uniforme por máquinas (devidamente guiadas, em momentos-chave, pela inteligência humana), deixando o processo de depender dos especialistas que, no modelo anterior, controlavam o processo do princípio ao fim.

Um pouco como a fábrica de calçado de Brunel.

A plataforma linguística da Unbabel

O que garante a qualidade da Unbabel não é a qualidade dos tradutores em si – cujo trabalho, mesmo a nível profissional, é muito variável e naturalmente propenso ao erro – mas a qualidade da plataforma que assegura, ao longo de várias etapas, um trabalho preciso e uniforme.

Continua a ser necessário recorrer à mão-de-obra humana, ainda que em momentos menos decisivos, cabendo aos nossos editores a tarefa, não de assegurar todo o processo de tradução, mas de corrigir e editar o trabalho automático. Isto elimina a dependência face ao fator humano mas aumenta consideravelmente a sua importância no processo de correção, possibilitando níveis de produtividade substancialmente maiores.

A Unbabel recebe conteúdo escrito numa língua de partida e devolve-o aos clientes numa das 27 línguas de chegada – ou, se assim for necessário, em todas elas.

De forma mais pormenorizada, o processo que nos leva de A a B compreende várias etapas.

Translation Pipeline

Encomenda

Uma encomenda é um pedaço de texto que é necessário traduzir. Pode ser um email do serviço de apoio ao cliente numa plataforma como a Salesforce, o Zendesk ou o Freshdesk; pode ser uma das centenas de descrições de produtos que constituem uma plataforma global de comércio eletrónico; ou podem ser legendas para centenas de horas de imagens de vídeo.

Embora cada tipo de conteúdo tenha o seu próprio ritmo na cadeia de tradução, dependendo de diferentes ponderações como a qualidade e a velocidade exigida, o processo é basicamente igual para todos os textos.

Preparação

Nesta fase, a Unbabel analisa o texto de origem, detetando e determinando uma série de fatores que influenciam o seu trajeto na cadeia de tradução.

Em primeiro lugar, executa-se uma série de ações em função do cliente que enviou o texto para a Unbabel. O sistema anexa automaticamente Glossários e Guias de Estilo personalizados (elementos que fazem parte do processo de integração do texto), ao mesmo tempo que oculta e anonimiza quaisquer dados de natureza confidencial (tais como números de cartão de crédito).

O sistema procede a uma análise sofisticada sobre a língua de origem, detetando elementos difíceis de traduzir (como locais, nomes e moradas) ao mesmo tempo que avalia o vocabulário utilizado, a extensão das frases e outros padrões de ordem gramatical para fazer uma estimativa sobre a dificuldade global do texto.

Constrói-se um modelo que articula estes dados com informações relativas ao tópico e ao tom do texto (formal ou informal), o que possibilita um encaminhamento inteligente do conteúdo para certos editores em função dos seus interesses específicos (viagens, desporto, medicina, entretenimento, etc.).

A Tradução Automática Adaptada da Unbabel

Adapted Machine Translation

Terminado o processo de preparação, dá-se início à primeira fase de tradução, que é inteiramente assegurada por um processo automático. Para começar, a Unbabel verifica a sua Memória de Tradução — um imenso repositório de dados cuja função consiste em garantir que uma frase que já foi traduzida para o mesmo cliente ou para o mesmo domínio é prontamente recuperada e reutilizada, possibilitando uma melhoria na velocidade de entrega e na consistência da tradução (ainda que essa frase possa ser alterada pelos nossos editores se o contexto estiver incorreto).

O passo seguinte é assegurado pelo Router de Tradução Automática,que escolhe os melhores motores de TA especializada com base no conteúdo, no domínio e no cliente (um e-mail de serviço ao cliente e uma descrição de um relógio de luxo artesanal requerem abordagens bastante diferentes).

De seguida, o texto que foi traduzido pelo nosso sistema é encaminhado para a Pós-Edição Automática,onde a Unbabel recorre ao que a nossa rede de editores humanos fez no passado para melhorar, de forma automática, estas traduções. Isto produz uma nova versão do texto, cuja qualidade é avaliada pelo nosso galardoado Sistema de Avaliação de Qualidade,sendo posteriormente encaminhado para as pessoas certas no interior da comunidade Unbabel.

Seleção de Editores

Editor Selection

A Unbabel tem uma comunidade global de 50.000 pessoas cuja função é rever os resultados desta tradução automática adaptada. Mas como saber a quem atribuir determinada tarefa?

Embora a Unbabel recorra a vários critérios para selecionar os editores de um texto, os mais importantes são a disponibilidade, a classificação interna em determinados tipos de conteúdo e a urgência da tarefa em questão.

A prioridade das tarefas é avaliada pelos ANS do cliente e por outros fatores, sendo cada tarefa colocada numa de duas filas de espera: uma verde e uma vermelha. Todas as tarefas começam na fila verde. Idealmente, não seria necessário recorrer a uma fila vermelha, mas esta existe por questões de backup e redundância, garantindo o cumprimento dos prazos.

Smart editor selection

Além disso, os nossos testes demonstram que os editores têm melhor desempenho quando recebem conteúdo no qual se mostraram interessados.

Smartcheck – Verificação Inteligente

Smartcheck

A partir do momento em que as tarefas são entregues às pessoas certas, a Unbabel procura ajudá-las a fazer o melhor trabalho possível, no menor espaço de tempo possível.

O Smartcheck (Verificação Inteligente) da Unbabel é uma espécie de versão avançada dos corretores ortográficos que existem nos editores de texto comuns. Este mecanismo verifica uma série de potenciais erros com sugestões para correções rápidas, incluindo ortografia, tom e consistência lexical (concordância entre o verbo e o sujeito; concordância de pronomes; género, etc.), bem como regras mais específicas determinadas pelas exigências do cliente.

Fazer com que cada editor leia o guia de estilo de cada cliente é uma abordagem pouco eficaz. Por esta razão, o Smartcheck introduz várias sugestões ao longo do texto, facilitando e acelerando a correção de erros não-gramaticais (tais como a confusão entre o tom subjetivo e objetivo e a representação de números por extenso).

A Rede de Auto-Aprendizagem da Unbabel

Network

A magia de todo este processo é que quanto mais materiais a Unbabel traduz, melhores são os resultados do sistema. Os motores de Tradução Automática podem ser reconfigurados, as Memórias de Tradução podem ser ampliadas e o sistema de Pós-Edição Automática vai melhorando a cada texto que passa.

Quanto mais materiais o sistema trabalha, melhor ele fica.

Empresas internacionais como o Pinterest, a Skyscanner, a Under Armour, o Trello e a Oculus VR confiam na plataforma empresarial da Unbabel para abrir e criar novos mercados.

Para agendar uma demonstração, entre em contacto connosco hoje..

ArtboardFacebook iconInstagram iconLinkedIn iconUnbabel BlogTwitter iconYouTube icon