Lumières, caméra, sous-titres : comment a été créé Unbabel Video

11 min read

À mesure que le public et le contenu que ce dernier consulte se sont élargis à l’échelle internationale, les sous-titres sont devenus un élément essentiel d’une bonne expérience utilisateur. 80 % des vues sur YouTube proviennent de l’extérieur des États-Unis et seulement 25 % des internautes parlent l’anglais couramment. En outre, 85 % des vidéos sur Facebook sont visionnées sans aucun son, ce qui rend les sous-titres essentiels pour satisfaire votre public où qu’il soit. Si vous ne rendez le contenu disponible que dans une seule langue, vous risquez que votre public (ainsi que les revenus issus de la publicité ou des abonnements) soit récupéré par quelqu’un d’autre.

Les sous-titres permettent non seulement aux spectateurs de visionner votre contenu, mais il leur permettent également de trouver ce dernier plus facilement. L’ algorithme de recherche de YouTube privilégie avant tout les vidéos sous-titrées car il est beaucoup plus efficace pour analyser et catégoriser le texte que les vidéos. Cela signifie plus de spectateurs et plus de revenus dans toutes les langues pour les créateurs de contenu.

La facilité d’analyse du texte par rapport à la vidéo n’est pas uniquement importante pour le référencement. Il est impossible d’exploiter la vidéo de la même manière que le texte pour obtenir des données et des informations. S’appuyer sur des légendes et des sous-titres de mauvaise qualité rend tout simplement impossible pour les humains ou l’IA de tirer des informations des interviews, des groupes de discussion ou des journaux vidéo.

Les méthodes actuelles de sous-titrage vidéo ne ralentissent pas uniquement les sociétés d’études de marché, d’ailleurs. Même les entreprises de média qui sont déjà expertes en traduction ont du mal à transcrire et à traduire le contenu vidéo de manière efficace, en s’appuyant sur des traductions uniquement automatiques peu fiables ou des équipes de traducteurs professionnels difficiles à intégrer. Cela peut souvent signifier plusieurs agences ou équipes, ainsi que des temps de traitement plus longs. Plus de temps de traduction signifie également moins de temps pour la création de contenu.

Les défis de la réalisation de sous-titres multilingues

Daavid Kahn, fondateur d’ Instapanel, souligne : « Le taux d’erreur de 5 % qui caractérise la plupart des services de transcription pourrait sembler insignifiant au début. Mais cette erreur se multiplie et a des répercussions en cascade dans toutes les étapes, et cela échappe à tout contrôle. »

Ce risque d’erreur de multiplication et d’effets en cascade est un risque majeur pour les sous-titrages multilingues. Il existe des options gratuites et entièrement automatisées pour créer des sous-titres en anglais. YouTube en a même une intégrée dans son lecteur. Cependant, des recherches universitaires ont montré que son taux d’erreurs était élevé (ces erreurs sont encore pires lorsqu’un accent n’est pas américain), et qu’il est également plus élevé pour les voix de femmes que pour les voix d’hommes. (J’ai un collègue originaire de Glasgow qui est particulièrement scandalisé par le fait que les accents écossais ont le taux d’erreur le plus élevé.) Un indicateur plus important des problèmes liés à ces sous-titres est que Google et YouTube n’utilisent pas ces options pour l’indexation des recherches car la qualité est insuffisante.

Si les sous-titres dans la langue d’origine sont médiocres, même la meilleure traduction sera fatalement imparfaite. Et si vous utilisez la traduction automatique (TA) pure, les problèmes s’aggraveront, votre public aura des sous-titres incompréhensibles, ce qui rendra vain tout l’exercice de traduction.

L’alternative est que la transcription et la traduction soient effectuées par des humains, qui fournissent un résultat de haute qualité, mais elle est très coûteuse et constitue souvent un défi de taille à gérer à grande échelle.

La traduction est ce que nous faisons chez Unbabel, et lorsque nous avons réalisé quels obstacles se dressaient face à la création de sous-titres multilingues de qualité native, nous avons vu là un défi à relever, notamment en utilisant notre expérience et notre technologie.

Présentation d’Unbabel Video

Cette solution est Unbabel Video, qui combine la puissance des traductions humaines et le flux de traduction utilisant l’IA d’Unbabel pour fournir des légendes et des sous-titres multilingues de qualité native en plusieurs langues pour tous les types de contenu vidéo.

Unbabel Video permet aux utilisateurs d’ajouter rapidement et facilement des sous-titres multilingues de haute qualité à leurs vidéos. Il vous suffit de coller un lien vers une vidéo de YouTube ou de votre propre vidéothèque et de sélectionner les langues dont vous avez besoin. Ensuite, nous créons les sous-titres en utilisant nos moteurs de traduction automatique de classe internationale et notre communauté mondiale de traducteurs multilingues. Ils sont prêts en peu de temps pour que vous puissiez partager votre contenu dans toutes les langues que vous souhaitez.

Unbabel Video offre à vos vidéos des sous-titres multilingues de qualité native rapidement, facilement et à l’échelle qu’il vous faut.

Retour en arrière : comment nous en sommes arrivés ici

Unbabel Video est l’aboutissement d’années d’essais et de recherches visant à optimiser notre modèle de traduction humaine + IA pour les vidéos. Le projet a débuté avec ma « Labs team », l’équipe d’innovation interne d’Unbabel, dont les projets testent les limites du possible.

Nous avons créé Unbabel Cast, une application qui vous permet de vous enregistrer et de traduire immédiatement ce que vous avez dit dans plusieurs langues, puis de le télécharger sur les réseaux sociaux. L’application fonctionnait parfaitement et notre PDG et co-fondateur Vasco Pedro l’ a fièrement présentée au monde sur scène lors de l’événement Pioneers 17.

Bien que nous ayons aimé utiliser Cast, nous avons décidé que créer une plateforme permettant de réaliser des sous-titres de haute qualité dans plusieurs langues à l’échelle de l’entreprise était un défi beaucoup plus excitant à résoudre ; nous nous sommes donc mis au travail.

L’équipe vidéo

Pour concrétiser ce concept, Unbabel Video a quitté « Labs » pour devenir un produit à part entière. Nous avons constitué une équipe entièrement dédiée à ce produit, en réunissant des personnes de la gestion de produit, de l’IA appliquée, de la gestion de communauté, des services linguistiques, de la conception de produit, du marketing de produit et les développeurs de produit en une seule équipe cohérente axée sur la création, la maintenance et l’extension du produit. Les membres de l’équipe sont venus à Lisbonne des quatre coins du monde, du Canada, du Brésil et des États-Unis à l’ouest, et même d’aussi loin que de l’Arménie à l’est.

L’équipe a créé de nouveaux outils et interfaces qui permettent à notre communauté de traducteurs de travailler sur des vidéos aussi rapidement et précisément que possible et ont trouvé de nouvelles façons d’aider à gérer la traduction de vidéos à grande échelle.

L’équipe Unbabel Video en juin 2018

Comment ça marche en coulisses

Tout comme la solution de service à la clientèle d’Unbabel, Unbabel Video combine une traduction automatique neuronale (NMT) d’avant-garde et une communauté humaine d’éditeurs indépendants pour obtenir des traductions de qualité native et rapides.

Lorsque nous créons des sous-titres, la version préliminaire est effectuée par notre traduction automatique neuronale, leader du secteur. Ensuite, notre communauté corrige les erreurs éventuelles par rapport à la vidéo afin de s’assurer qu’elle est aussi précise que possible. Cela crée non seulement des sous-titres de très haute qualité, mais nous fournit également la meilleure base possible pour les traductions en éliminant les erreurs qui seraient amplifiées au cours du processus.

Lors de la phase de traduction, les sous-titres dans la langue originale et la vidéo sont présentées à notre traduction automatique afin de s’assurer que les traductions sont exactes et restent synchronisées dans la nouvelle langue.

Pour améliorer la vitesse et la précision, nous avons créé des outils entièrement nouveaux qui combinent les mécanismes de productivité d’un correcteur de texte à un lecteur vidéo intuitif, ce qui permet à nos éditeurs-correcteurs de se concentrer sur leur travail sans être obligés d’apprendre à utiliser ces outils. Nous avons testé et itéré ces interfaces à plusieurs reprises, et nous avons réalisé des progrès inespérés en réduisant le temps nécessaire à notre communauté pour sous-titrer ou traduire chaque minute de vidéo. Cela signifie des résultats meilleurs et plus rapides pour nos clients et des traducteurs plus satisfaits.

Utilisation d’Unbabel Video

Unbabel Video a été l’opportunité de créer une plateforme de traduction de vidéos à partir de zéro, qui serait facile à utiliser quel que soit le nombre des vidéos. C’est pourquoi Unbabel Video est intégrée à YouTube ; ainsi, il suffit aux utilisateurs de simplement coller un lien vers leurs vidéos plutôt que de les télécharger directement sur nos serveurs. Cela fonctionne également si la vidéo est hébergée sur les propres serveurs du client.

De plus, nous avons créé une API robuste et intuitive et sommes ouverts à l’intégration à toute plateforme de gestion des actifs numériques que nos clients utilisent afin de simplifier au maximum leur flux de travail.

Nous avons également développé des fichiers de projets archivables qui permettent à nos clients de gérer leurs projets en cours tout en ayant accès à toutes les traductions demandées. Pour ce faire, nous nous étions basés sur les commentaires de nos clients de développement qui commençaient à rencontrer des problèmes à cause de grandes quantités de vidéos.

Contrôle qualité

Comme pour les produits de service client d’Unbabel, nous évaluons régulièrement la qualité des traductions pour nous assurer de fournir un travail de haute qualité à nos clients. Cependant, passer de la traduction de texte seul à celle de vidéos apportait une difficulté supplémentaire quant à la manière d’évaluer la qualité de la traduction.

Pour garantir une qualité constante, nous avons travaillé avec une communauté de linguistes afin de mieux comprendre quelles erreurs étaient susceptibles de se produire lors de la traduction de sous-titres par rapport à d’autres types de contenu. Cela nous aide à signaler efficacement et à assigner à nos traducteurs humains des segments à corriger, et à évaluer leur travail avec plus de précision. Nous effectuons des évaluations régulières de chaque traducteur de notre communauté et des audits de qualité réguliers pour chaque client afin d’être sûrs de toujours avoir la vue d’ensemble la plus précise possible de la qualité de nos traductions.

Avance rapide jusqu’à aujourd’hui

Unbabel Video n’est plus une idée folle d’application ou une expérience ; c’est un produit extrêmement efficace qui est devenu un outil clé pour des entreprises telles que Living Lens et Instapanel, qui ont combiné notre traduction avec leur apprentissage automatique innovant pour fournir des informations globales à leurs clients. Great Big Story a été en mesure de diffuser ses formidables vidéos à un public beaucoup plus large en Amérique latine qu’auparavant.

C’est pourquoi Unbabel Video fait maintenant partie d’un programme d’accès anticipé (EAP), afin de trouver un nouveau groupe de clients sélectionnés désireux de se démarquer grâce à notre produit et de travailler avec des cas d’utilisation et des volumes réels.

Nous cherchons particulièrement à travailler avec des entreprises de médias qui souhaitent étendre la portée de leur contenu en offrant des sous-titres multilingues, ou avec celles qui le font déjà avec une équipe de traduction et qui pourraient utiliser Unbabel Video pour améliorer l’efficacité et augmenter le rendement.

L’autre cas d’utilisation clé de l’EAP concerne les études de marché. Unbabel Video permet aux chercheurs de tirer des enseignements des témoignages dans toutes les langues et de donner à leurs clients une vision véritablement globale de ce que leurs propres clients pensent de leurs produits.

Cependant, si vous êtes dans un autre secteur d’activité et pensez qu’Unbabel Video vous serait utile, n’hésitez pas à postuler pour faire partie du programme, nous sommes toujours ravis de discuter de nouveaux cas d’utilisation et d’utiliser les vidéos multilingues dans d’autres domaines.

Faire partie de l’EAP signifie que vous pourrez travailler en étroite collaboration avec notre équipe produit pour adapter de façon parfaite le produit et ses fonctionnalités à votre flux de travail et à votre cas d’utilisation, ainsi que bénéficier de réductions sur les prix. Cela vous permettra également d’avoir une longueur d’avance sur la concurrence.

Si cela vous intéresse, vous pouvez demander à faire partie du programme d’accès anticipé ici, et notre équipe vous contactera pour en discuter plus en détails. Mais soyez prévenus, nous sommes tellement enthousiastes à propos d’Unbabel Video que nous pourrions en parler pendant un bon moment…

ArtboardFacebook iconInstagram iconLinkedIn iconUnbabel BlogTwitter iconYouTube icon