Overhyping Neural机器智能翻译:“很容易打败Google”

1 min read

每天都有新人出入我们的办公室,我们已经对此习以为常。但是,当某位机器智能翻译之父走进门来时,足以令我们欣喜若狂。

那就是当 就职于都柏林城市大学(Dublin City University)ADAPT中心的 Andy Way教授在里斯本加入我们的首期“Understand withUnbabel”节目时的场景。

请观看下面的采访:

Andy Way教授自1988年起就一直从事机器智能翻译方面的工作,他也是该领域的世界顶尖级研究人员之一。但是,正如他喜欢指出的那样,即使他已经在机器智能翻译领域工作了很长时间,长到足够被冠以”该领域之父“的头衔,但其实早在他着手之前人们就开始从事机器智能翻译的工作了。

[mkdf_separator class_name =“”type =“normal”position =“center”color =“”border_style =“”width =“”thickness =“”top_margin =“”bottom_margin =“”]

机器智能翻译的起源以及围绕着它的质疑

机器智能翻译在过去十年中已经赢得了很大反响,但是无论你相信与否,人们已经在这个领域辛苦研究了近六十年。追溯到1949年,Andy教授曾说过:

“沃伦·韦弗(Warren Weaver)写过一封很有名的关于 机器智能翻译可能性的信,信上说我们可以借鉴一下从战争中学到的有关编码以及解码和编码秘密信息的一些经验,并且尝试使用类似的技术来处理人类语言”。

一切就是从那时开始的。

然而,初期的热情并没有持续很长时间,而是自然而然地被质疑所取代了。曾经有份臭名昭彰的报告从本质上预测了机器智能翻译没有前途,因为机器永远无法消除歧义性的问题。

像pen这类的词语,是把它翻译成作为书写工具的“笔”,还是翻译成将动物们围在其中的“牲畜圈”,对于机器智能翻译来说是极大的挑战。

尽管仍然有质疑存在,但研究人员从那时起就扭转了局面,而机器智能翻译尤其是神经机器智能翻译(NMT)已经成为过去几十年来最大的技术趋势之一。大到看似这即将成为大家都热烈谈论的下一个大事件。

[mkdf_separator class_name =“”type =“normal”position =“center”color =“”border_style =“”width =“”thickness =“”top_margin =“”bottom_margin =“”]

神经机器智能翻译:它会将人工翻译从该等式中去除掉吗?

“神经机器智能翻译已经出现,而且看起来真的是秒杀以前的各种翻译方式。它正在迅速成为一项新的顶尖技术”。

神经机器智能翻译就像是一个通过模仿生物神经网络而仿人类大脑运作的计算机系统。这种系统自己为自己提供数据以逐步学习,并且因此提升自己的翻译能力。

这其实就是 我们在Unbabel使用和开发的系统。但是,它会取代人工在文字翻译过程的作用吗?

尽管很疯狂,据Andy授看来,“对待这种大肆宣扬我们需要持谨慎态度”,因为仅仅依靠神经机器翻译本身是不能够提供准确的人工翻译的。

Google在他们2016年发表的一篇文章中甚至表示,他们的机器智能翻译水平已经非常接近人工翻译的质量。“刚听到这个消息的时候,翻译人员都有点被吓到了”Andy说,“远离翻译工作者是你最不想要做的一件事”。为什么? 因为 “人工环节永远是整个翻译过程中最重要的部分”。

因此,人是整个等式中起关键作用的一个部分,Andy Way教授告诉了我们其中的原因:

“机器智能翻译质量通常是非常非常好的,甚至有时候是带有很强误导性的好。因此,神经机器智能翻译可能产生非常流畅的翻译结果,但却与实际源语言没有一点关系。他们不是很好的翻译,但这些内容可能翻译起来相当困难。在最终文档被发送给客户之前,需要进行人工检测进行确认”。

为了让神经机器智能翻译能够起作用,“我们需要把人工翻译内容引入到我们的系统”并以此训练机器智能翻译。 一旦系统接收到数据,它就开始学习数据的模式并生成更好的翻译。

“如果我们设想一下没有翻译者的话我们会怎样,我们甚至无从开始”,Andy说道。这个秘诀在于“让机器做机器擅长做的事情,然后让人工元素稍微做检验、做修正、做更新源数据之类的工作。”

但Google及其人工翻译质量是怎样的呢? “我总是对我的学生说,Google不是机器智能翻译公司”,Andy回答道。

“如果我是与潜在客户或行业合作伙伴交流,我绝对不会害怕与Google竞争,因为在一个定义明确的情境中,我们已定制用户数据,我们可以随时训练引擎,并提供人工翻译中的反馈意见以改善引擎,这是你无法使用Goolgle做到的。“

实际上,根据Andy Way教授的说法,其实“要胜过Google的现有解决方案是很容易的”。


这里观看整段采访订阅我们的实时通讯 以接收即将推出的新一期“Understand with Unbabel”,我们在这一系列的节目中深入探讨当我们加速朝向没有语言障碍的世界进发时所面临的问题、话题和挑战。

ArtboardFacebook iconInstagram iconLinkedIn iconUnbabel BlogTwitter iconYouTube icon