Der Aufbau der Übersetzungsschicht der Welt ist eine fantastische Mission. Das bedeutet für uns, ein transversaler und allgegenwärtiger Service zu werden, der immer, überall und zu jeder Zeit, aus einer Kombination aus Künstlicher-Intelligenz-Technologien, (maschineller Übersetzung und einer Auswahl von Maschinen-Lernmechanismen) und einer wachsenden globalen Gemeinschaft von Zweisprachigen, Kommunikationsbarrieren beseitigen kann. 

Dies bedeutet auch, Aufnahme, Verarbeitung und eine große Menge an Daten pro Sekunde zu verteilen, während gewährleistet wird, dass die Standards unserer Kunden für Qualität und Geschwindigkeit erfüllt sind. 

Wenn Sie nicht damit vertraut sind, wie Unbabel funktioniert, finden Sie hier weitere detailierte Informationen, aber hier ist eine kurze Zusammenfassung: 

translation pipeline

  1. Ein Übersetzungsauftrag wird über unsere API oder über Integrationen mit Plattformen wie Salsforce und Zendeskangefordert;
  2. Unsere über KI betriebene Übersetzungspipeline wird den Auftrag aufnehmen und ihn für die maschinelle Übersetzung durch einen Prozess schicken, der auf den Content-Typ und auf den Auftraggeber angepasst ist;
  3. Sobald der Maschinenübersetzungsmotor das Qualitätsbeurteilungssystem (QE) beendet hat, wird überprüft werden, ob die Ausgabequalität gut ist, und wenn ja, kann es verschickt und unverzüglich an das anfordernde System gesendet werden, von dem es kam;
  4. Wenn die QE es für notwendig erachtet, dass endgültige Anpassungen durch einen Menschen notwendig sind, wird der Text in mehrere Einheiten aufgeteilt und an unsere Gemeinschaft gesendet;
  5. Wenn die Gemeinschaft die letzten Anpassungen vorgenommen hat, wird der endgültige Text wieder zusammengesetzt und entsprechend geliefert.

Vereinfacht gesagt, es werden viele Teile von einem Ende zum anderen bewegt. Wie halten wir also mit einem solchen Aufbau Qualität und Geschwindigkeit in großem Umfang?

Qualität skalieren

Die Unbabel KI entwickelt sich kontinuierlich, nicht nur, weil unser KI-Team täglich daran arbeitet, um die bestehenden Algorithmen im Kern zu verbessern, sondern auch, weil sie anhaltend aus eigenen Ergebnissen und den proprietären Daten, die wir sammeln, lernt.

Ein Datentyp, zu dem wir Zugang haben, sind linguistische Annotationen zu der Arbeit, die wir übersetzt haben. Ein globales Team aus Sprachexperten arbeitet rund um die Uhr, um unsere Übersetzungen mit qualitativen und quantitativen Informationen zu versehen, die uns zu verbildlichen ermöglichen, was bereits funktioniert und was verbessert werden kann. Weiter vergrößert es die Fähigkeit der gesamten Pipeline, kontinuierlich Ergebnisse von höherer Qualität zu produzieren. 

Wir können außerdem unsere ursprünglichen machinellen Lernmodelle überdenken und sie in regelmäßigen Abständen aktualisieren. Viele Daten bedeutet bessere Modelle, was wiederum eine bessere maschinelle Übersetzungsqualität bedeutet. 

KI-Lernautomatisierung 

Der Schlüssel zu einer gesunden Entwicklung der Pipeline ist, kleine Erweiterungen vorzunehmen und diese oft einzusetzen. Dies ist eine allgemeine Best Practice und kann in jeder DevOps-Literatur nachgelesen werden. Wir führen dieses Mantra sogar noch einen Schritt weiter und wenden es darüberhinaus auf unseren KI-Lernprozess an.

Wir haben den gesamten Prozess mit Hilfe einer autonomen Zeitplanungs-Pipeline automatisiert, welche:

  1. Ein ETL-Verfahren aus dem Datenspeicher im Ruhezustand ausführt;
  2. Daten durch einen Anonymisierungsverfahren laufen lässt  so dass jegliche persönliche Information oder andere sensible Daten entfernt werden; wir benötigen und wollen diese Daten nicht und wir verhindert somit, dass diese Daten unsachgemäß verbreitet werden.
  3. Daten in Unbabels Trainingssysteme umwandelt und lädt, welche parallel GPU-basierte Trainingssysteme aktivieren;
  4. Trainingsmodell-Ergebnissen basierend auf einer Sanity Test Suite ermittelt und prüft;
  5. Den KI-Server mit den neuen Modellen aktualisiert.

Da wir kunden- und kategoriebasiert liefern: Gebietsanpassung, dieser Prozess wird für alle Modelle ausgeführt, um sicherzustellen, dass unsere maschinellen Übersetzungstools immer mit den neuesten verfügbaren Daten versorgt werden.

developers deploy systems

Lieferung 

Unsere Softwareentwicklungs-Architektur ist so konzipiert, dass wir problemlos vertikal und horizontal skalieren können. Mit einem Microservices- Modell können wir die Übersetzungs-Pipeline entsprechend nach oben oder nach unten skalieren, was insgesamt zu einer Effizienzsteigerung beiträgt. 

Die meisten unserer Server basieren auf Container- Technologien und somit ist es genauso einfach, einen KI-Server zu aktualisieren wie jeden anderen Teil des Systems. Microservice und Container gehen Hand in Hand mit dem Konzept einer unveränderlichen Architektur, in der alle zustandslosen Teile wegwerfbar, austauschbar und erweiterbar in Echtzeit sind und mit den richtigen Methodiken ohne Ausfallzeiten.

Skalierungs-Geschwindigkeit

Wenn es darum geht, was wir bisher behandelt haben, sind unsere Reaktionszeiten im Wesentlichen in Echtzeit. Diese Ergebnisse werden dann an unsere zweisprachigen Post-Editor verteilt und es ist möglich, dass noch einige erhebliche Anpassungen vorgenommen werden müssen, um die Qualität zu erreichen, die unsere Kunden von uns erwarten und fordern. 

Das heißt nicht, dass Menschen langsam übersetzen, sondern im Gegenteil, viele Studien zeigen, dass sie oft schneller maschinelle Übersetzungen nachbearbeiten, als von Grund auf neu zu übersetzen, aber das Verständnis von Kontext, mögliche technische Details, sprachlichen Mehrdeutigkeiten und andere kulturelle Empfindlichkeiten benötigen immer eine gewisse Zeit, um ein akzeptables Ergebnis zu gewährleisten. 

Unbabel Editor-Benutzeroberflächen verbessern 

Sowohl unsere webbasiertes Schnittstelle als auch unsere mobilen Anwendungen, auf den beiden großen Plattformen bieten wir unserer globalen Gemeinschaft von mehr als 50.000 zweisprachigen Übersetzern eine Benutzeroberfläche, die eines der wichtigsten Teile des gesamten Puzzles ist. 

Wenn wir hohe Qualität weiterhin so schnell wie möglich liefern wollen, dann müssen wir die Werkzeuge unnachgiebig verbessern, damit unsere Lektoren jederzeit an Übersetzungsaufgaben arbeiten können, an jedem Ort. 

Wir sind in ständigem Kontakt mit unserer unglaublichen und engagierten Gemeinschaft und sind stolz darauf, auf deren Feedback zu hören und danach zu handeln. Um Benutzertests über unsere vorhandenen Interfaces durchzuführen und bezüglich derer, die wir erwägen einzusetzen. Deren Interaktionen auf der Plattform messen, um neue Wege zu finden, um die Dinge noch weiter zu verbessern. Alles, was die Reibungslosigkeit gewährleistet und unserer Community ermöglicht, bessere Arbeit zu leisten, schneller, mit erhöhter Zufriedenheit, ist absolut entscheidend für unsere Mission. 

KI +Mensch= bedarfsgerechte Qualität und Geschwindigkeit

Qualität und Geschwindigkeit könnte manchmal als widersprüchliche Wahl wahrgenommen werden und die Skalierung von beiden ist in der Tat eine immense technologische Herausforderung, aber es ist der Schlüssel zu unserem Erfolg als Unternehmen. 

Wir werden oft gefragt, ob Übersetzung nicht ganz von KI übernommen werden kann“, aber Jahrzehnte und Milliarden, die in die Forschung gesteckt wurden, haben gezeigt, dass es bei der Erfassung von Mehrdeutigkeiten, Eigenheiten und Paradoxen der menschlichen Sprache immer eine Lücke geben wird. 

Nur durch Entwicklung der symbiotischen Beziehung zwischen künstlicher und menschlicher Intelligenz können wir die Übersetzungsschicht der Welt bauen.