Comment le pipeline de langues d’Unbabel fournira une traduction de qualité humaine

10 min read
Unbabel Translation

Dans un marché de 38 milliards de dollars par an en services de traduction et de localisation, le plus important participant est un entrepreneur militaire qui génère 730 millions de dollars par an. Le reste de la liste de 10 génère entre 80 et 430 millions de dollars par an.

Il s’agit d’un marché largement fragmenté, présentant une longue file d’intervenants qui pratiquent des modèles d’affaire très similaires. Des places de marché au flux rapide d’un côté, de grandes associations de traducteurs professionnels de l’autre, qui postulent en fonction de leurs compétences, expérience et résultats. Une fois qu’une offre est remportée, chaque traducteur appliquera ses talents à un élément de contenu à la fois. Besoin d’autres langues ? Embauchez plus de traducteurs.

C’est ainsi que cela a toujours fonctionné. Mais l’histoire récente a montré que ce qui n’est pas évolutif n’est pas durable. Et une fois que vous avez découvert une nouvelle manière de faire les choses, d’énormes nouveaux marchés au potentiel inexploité sont à portée de la main.

Translation Market

Pour Unbabel, la traduction comme elle existe actuellement constitue une partie du problème.

Comment traduisez-vous absolument tout ?

Comment faire si vous souhaitez traduire toutes les informations du monde dans toutes les langues et le faire presque instantanément ? Pas uniquement des documents juridiques, conditions générales et catalogues de produits, mais tous les e-mails, les conversations de chat, tous les sous-titres, chaque élément de contenu imaginable.

Pour relever le défi, vous devez fondamentalement repenser la façon dont fonctionne le procédé de traduction. Non pas comme un problème qui consiste à impliquer beaucoup d’individus, mais plutôt comme un problème de logiciel où un processus peut être défini et continuellement amélioré afin de produire une meilleure qualité.

Certaines entreprises de technologie voient déjà le monde de cette façon, mais ne parviennent pas à répondre aux besoins de la plupart des entreprises et des organisations pour combler l’énorme fossé entre les traductions automatiques les plus avancées et celles effectuées à la mode ancienne, c’est- à- dire par un être humain.

Pour être prises au sérieux, les entreprises modernes ont besoin d’une solution qui puisse comprendre la situation contextuelle de ton et de style, lire entre les lignes, et repérer les erreurs détectées dans la course à l’automatisation totale.

Cordonniers vs. Production de chaussures

Pour comprendre ce que fait Unbabel en matière de traduction, pensez à la cordonnerie au XVIIIe siècle.

Au cours de toute l’histoire de l’humanité, les chaussures ont été fabriquées une à la fois et à la main. À une telle échelle personnelle, chaque paire était conçue pour convenir à son propriétaire à grands frais de temps et d’énergie, et il s’agissait par conséquent d’un service pris en charge par un petit pourcentage d’une population uniquement.

Mais au milieu du XVIIIe siècle, les services de cordonnerie ont commencé à être commercialisés à une échelle jamais vue auparavant. Une industrie artisanale a explosé pour emboîter le pas au monde de l’industrialisation, avec des milliers de cordonniers donnant le meilleur d’eux-mêmes sans répit pour satisfaire la demande (un peu comme la longue liste d’agences de traduction mentionnées plus haut).

Les guerres Napoléoniennes ont fourni la poussée nécessaire à la mécanisation des processus de production, grâce au célèbre ingénieur anglais Marc Brunel qui a développé des machines pour aider la production de masse de bottes destinées aux soldats de l’armée britannique. Un visiteur de son usine de Battersea a écrit ce qui suit :

« Chaque étape est effectuée par les machines les plus élégantes et précises… tous les détails sont obtenus par l’application ingénieuse des dispositifs mécaniques ; et toutes les parties sont caractérisées par la précision, l’uniformité et l’exactitude. Étant donné que chaque individu n’accomplit qu’une seule étape du processus, ce qui implique qu’il n’a aucune notion de ce qui est effectué par ceux qui passent avant ou après lui, les personnes employées ne sont donc plus des cordonniers, mais plutôt des soldats blessés qui arrivent à se familiariser avec leurs tâches respectives en l’espace de quelques heures. »

Si vous voulez entièrement éliminer la barrière des langues, si vous voulez permettre à chacun de comprendre et d’être compris dans toutes les langues et sur n’importe quel support, alors vous devez extraire le problème de la traduction pour atteindre un niveau beaucoup plus élevé que « plus de gens ».

Vous devez le fragmenter en une série d’étapes d’un travail mécanique précis, uniforme et exact, guidé par des mains humaines à des intervalles clés, et pas nécessairement par les experts qui accomplissaient ce même travail entièrement par eux-mêmes auparavant.

Un peu comme l’usine de chaussures de Brunel.

Pipeline de langues de Unbabel

Ce qui garantit la qualité chez Unbabel n’est pas la qualité des traducteurs individuels – qui, même à un niveau professionnel, peut varier considérablement et qui sont naturellement sujets à des erreurs humaines (ce sont, après tout, des humains) – mais la qualité de l’organisation qui exécute le travail en étapes précises, uniformes et exactes.

Le travail humain est toujours nécessaire, mais il intervient à des moments non critiques pour corriger les travaux effectués par la machine, plutôt que de se charger du travail de traduction dans son ensemble. Cela supprime la dépendance humaine, mais augmente considérablement la valeur globale des corrections de qualité et permet un débit exponentiellement plus élevé du contenu.

À un niveau élevé, Unbabel ingère le contenu du texte dans une langue source à un terminal, puis l’expédie aux clients dans l’une ou l’ensemble des 27 autres langues cibles.

En regardant de plus près, il existe un certain nombre d’autres étapes qui se déroulent entre A et B.

Translation Pipeline

Commande

Une commande est un morceau de texte qui doit être traduit. Il peut s’agir d’un e-mail du service client sur une plate-forme telle que Salesforce, Zendesk ou Freshdesk, ou l’une parmi des millions de descriptions de produits sur une plate-forme mondiale de commerce électronique, ou des sous-titres pour des centaines d’heures de séquences vidéo.

Chaque type de contenu aura son propre flux personnalisé dans le pipeline, en plaçant des priorités différentes sur les aspects comme la qualité et la vitesse, le processus général étant le même pour tous les textes.

Préparation

À ce stade, Unbabel analyse le texte source, en détectant et en déterminant une série de facteurs qui vont influencer son voyage à travers le pipeline.

Tout d’abord, un certain nombre d’actions sont prises en fonction du client Unbabel dont provient le texte. Les glossaires et les guides de style personnalisés qui constituent une partie du processus d’accueil sont automatiquement notés dans les commandes, et les informations sensibles comme les numéros de cartes de crédit sont rendues illisibles et anonymisées.

Des analyses sophistiquées de la langue source sont effectuées, incluant la détection des éléments difficiles à traduire tels que les emplacements, les noms et adresses, et l’estimation de la difficulté globale du texte, en fonction du vocabulaire utilisé, de la longueur des phrases et d’autres modèles grammaticaux.

Un modèle est construit qui unit ces données avec d’autres idées sur le ton du document (formel vs. informel), et qui en détecte le sujet, ce qui permet le routage intelligent du contenu vers certains éditeurs en fonction de leurs intérêts déclarés (voyages, sport, médecine, divertissement, etc.).

Traduction automatique adaptée d’Unbabel

Adapted Machine Translation

Une fois que la préparation a eu lieu, le premier travail de traduction est effectué entièrement par une machine. Pour commencer, Unbabel vérifie sa mémoire de traduction – un ensemble immense et dynamique de données qui détermine que lorsqu’une phrase complète a déjà été traduite pour le même client ou dans le même domaine, celle-ci sera récupérée et réutilisée, permettant une amélioration potentielle de la rapidité de livraison et la cohérence de la traduction (même si elle peut encore être modifiée par la suite par des éditeurs humains si le contexte ne correspond pas).

L’étape suivante se déroule via le routeur de traduction automatique.Il choisit les meilleurs moteurs de TA spécialisés, en fonction du contenu, du domaine et du client (un e-mail client vs. la description de produit de montres de luxe assemblées à la main ayant des exigences différentes).

Le contenu traduit automatiquement est ensuite transféré au post-éditeur automatique, où Unbabel est capable d’améliorer ces traductions automatiques en tirant parti des connaissances que le réseau humain a déjà acquises auparavant. Cela produit une nouvelle version dont la qualité va être évaluée (en utilisant notre système de primes à la qualité évaluée) et distribuée aux membres compétents de la communauté Unbabel

Sélection d’éditeurs

Editor Selection

Unbabel réunit une communauté mondiale de 50 000 personnes qui sont chargées d’examiner les résultats de l’adaptation de cette traduction automatique. Mais comment savoir qui reçoit quelle tâche ?

Il existe plusieurs critères de sélection de l’éditeur, mais les principaux se résument ainsi : qui est disponible, leur score (pour certains types de contenu), et à quelles points les tâches nécessitant d’être terminées sont urgentes.

La priorité des tâches est déterminée par l’accord sur le niveau de service client et d’autres facteurs, et elles sont classées dans une file d’attente verte ou rouge. Toutes les tâches commencent dans la file d’attente verte, et dans un monde idéal, il n’y aurait pas de file d’attente rouge, mais elle existe pour la sauvegarde et la redondance, afin que les délais soient respectés.

Smart editor selection

De plus, nos tests révèlent que les éditeurs auxquels on affecte du contenu qui les intéresse, offrent un meilleur rendement des tâches.

Smartcheck

Smartcheck

Une fois que les personnes compétentes ont reçu les bonnes tâches, Unbabel s’attache à les aider à présenter la meilleure traduction possible, en un temps record.

Smartcheck (vérification intelligente) de Unbabel correspond à une version suralimentée de correction grammaticale figurant dans les documents communs des éditeurs. Elle vérifie une gamme d’erreurs potentielles et propose des suggestions utiles afin d’apporter des corrections très rapides, notamment pour l’orthographe, le ton, la cohérence lexicale (accord sujet et verbe ; correspondance des pronoms ; genre, etc.) et les règles plus spécifiques en rapport avec les exigences énoncées par le client.

Il n’est pas efficace de faire lire à chaque éditeur les guides de rédaction de chaque client, c’est pourquoi Smartcheck dispense automatiquement des conseils du début à la fin du texte, facilitant grandement la correction d’erreurs non-grammaticales comme les tonalités subjectives vs tonalités objectives ou l’écriture des nombres en toutes lettres plutôt qu’en chiffres.

Réseau d’auto-apprentissage d’Unbabel

Network

De la magie de tout ce processus résulte que plus Unbabel traduit, plus les résultats du système s’améliorent. Les moteurs de traduction automatique peuvent être recyclés, les mémoires de traduction peuvent devenir plus étendues, et le processus de post-édition automatique s’optimise à chaque passage d’un nouveau texte.

Plus vous entrez d’informations, plus vous améliorez le système.

Des entreprises de niveau international comme Pinterest, Skyscanner, Under Armour, Trello et Oculus VR font confiance à la plate-forme d’entreprise d’Unbabel pour développer et s’ouvrir à de nouveaux marchés.

Pour planifier une démonstration, contactez-nous dès aujourd’hui.

ArtboardFacebook iconInstagram iconLinkedIn iconUnbabel BlogTwitter iconYouTube icon