恰到好处:为何众多公司信赖 Unbabel 提供的多语言客户沟通

1 min read
Evolution

许多像谷歌、微软、雅虎、Yandex、易趣和亚马逊这样的大公司创建并培训通用型机器翻译(MT)系统,该系统使用数十亿的数据点(如整个互联网),从而帮助理解其他语言的在线内容。

如果您是 MT 行业的一名敏锐观察者,可能已了解这些系统近期都升级成为“神经机器翻译”。然而,通用 MT ≠ 商业 MT

虽然质量一定会有所提高,但是,当通用型 MT 系统用于其被培训之外的不同领域(通常是新闻文章、议会程序等)时就如同离开了水的鱼。若将其中一个系统插入与国际客户的电子邮件和聊天对话,或者诸如产品说明一类的商业关键信息中,则很快这些内容听起来会很滑稽。

正式和非正式的语气产生混淆,实体名称被误译,应该保持一致的品牌术语变得混乱,并且还会自动产生大量其他错误,这些都使得内容无法适应企业环境所需达到的目的。

毫无疑问,神经网络技术显著提高了 MT(尤其在流畅度方面),但是在这些技术和当今跨国企业所期望的质量之间仍然存在巨大的鸿沟。

Unbabel 的域适配 MT 性能

为了达到严苛的标准,我们首先接受机器翻译的限制,并使其符合我们的 MT +人工编辑的工作流程。

证据表明,更好的 MT 系统可减少后期编辑,从而最终取得更快更好的翻译质量。

Maria at Unbabel

我们最近进行了一系列实验,将 Unbabel 的域适配 MT 与通用 MT 系统(有和无神经 MT)在 5 种热门语言对(英语译为西班牙语、法语、葡萄牙语、意大利语和德语)中进行了比较。

根据来自Unbabel for Zendesk Unbabel for Salesforce Service Cloud 的客户服务票据,我们使用 MT 评估标准自动指标 BLEU scores 对我们的表现分析如下:



Unbabel 的域适配 MT 始终取得更高的分数,有时甚至相当突出,由此证明我们针对客户数据培训机器的假设非常有价值。这对于科学界虽已不是新闻,但对于商界的很多人来说可能还是很新的理念。

我们还省略了术语表创建功能,基于每名用户来校正系统,以确保在翻译过程中考虑风格指南、品牌术语和其他元数据。例如,Pinterest 不希望将“Pin”一词翻译成西班牙语“Alfiler”在翻译过程中会多次提示。

也就是说,这些内容值得一再强调,而这只是我们满足客户需求的开始。在 Unbabel,我们坚信只有通过将人工智能与人力相结合才能“解决”翻译问题。

André and Ramon at Unbabel

机器工作完成后,下一步则是将生成的内容分配给我们智能化选中的 45000 名移动语言学家,然后他们将内容进行后期编辑以达到我们客户所期望的人工品质。

我们将在另外一篇文章中介绍这一部分。


致谢:
Unbabel 研究部主管  André Martins 博士 在  Maria Braga 和 Catarina Cruz Silva 的帮助下领导开展了这些实验。

注:

  • 我们采取了一些基本措施以避免 常见误区,确保在该数据集中没有句对与我们 MT 翻译系统的培训数据集相重叠。
  • 我们的对比更支持谷歌系统,因为在这些实验中参考翻译是通过对谷歌翻译进行人工后期编辑而完成的(因此在绘图中标有星号)。
  • 我们没有汇报意大利语的谷歌神经机器翻译结果,因为它们的升级 API目前不支持该语种。
ArtboardFacebook iconInstagram iconLinkedIn iconUnbabel BlogTwitter iconYouTube icon