Unbabel的研究部主管刚赢得140万欧元来打造下一代的机器智能翻译模型,这里是我们与他的问答。

1 min read

Unbabel的研究部主管André Martins因其拟议的为期五年的DeepSPIN — 自然语言处理的深层结构预测项目而被授予著名的欧洲研究理事会(ERC)的启动基金。

随着数字助理、通信应用程序和客户服务机器人等众多新型语言界面的不断涌现,André坚持认为这些新兴技术还有很长的路要走:

尽管取得了自然语言处理的许多突破,机器智能翻译、语音识别和深层神经网络目前缺少关键的结构机制来解决复杂的现实世界任务。

例如,当前机器智能翻译系统一次只能输出一个单词,这往往会衍生错误。即使他们产生流畅的输出,他们也经常无法理解源文本的信息。最重要的是,目前的神经网络不能进行复杂的推理,它们的训练需要太多的监督,而且其决定也不能被人类解译。

如果我们想要人工智能和人类一起工作,这个问题必须要解决。

我们需要考虑自然语言结构的新一代机器学习模型、方法和算法,以便对我们周围的世界进行深入推理。

André希望以144万欧元的资金招聘三名博士后研究人员和三个博士生,在接下来的五年时间里推动深度学习、机器智能翻译和翻译质量评估的最先进技术。

André和我们一同坐下,详细介绍了这个项目:


与Unbabel研究部主管André Martins的问答

您说“深度学习是自然语言处理领域的革命”。为什么会这么说呢? 您能解释一下深度学习是什么吗?

当然! 深度学习是一套统计学习方法,藉由机器处理更多数据的经验来帮助它们从中学习,或提高其表现。深度学习与其他方法的区别是学习内部表征的能力。

神经网络是最流行的例子:它们由多个以多层方式连接在一起的单元(称为人工神经元)所组成,不同的层捕捉不同的表征水平(从单词到句法短语到语义概念)。

在过去的2-3年里,这些模型在如机器智能翻译、语音识别和问答等自然语音言处理仼务中取得了新的突破。

近几年来,我们目睹了Amazon的Alexa、Apple的Siri等数字助理,客户服务机器人和通信应用程序的兴起。您如何看待这些技术的发展? 我们距离这些工具表现得像人类一样又有多远? 为什么?

这些技术在过去的几年里已经进化了很多,现在它终于变得具有实用价值了。但是,他们离“像人类一样”还差很远。

它们说的话通常听起来很流畅,能自动化与定制大量的日常任务,但是只需要几次互动就可以理解到这些工具不能够深度推理来解决更复杂的任务。您目前需要为此结合AI和人类。

您说这个研究项目将专注于接合深度学习和结构预测,以解决自然语言处理中的挑战性任务,包括机器智能翻译、质量评估和句法分析。您能解释一下这是什么意思吗?

语言是充满结构的:我们从语素形成单词,然后把单词合并成短语,这又形成句子,等等。

理解这个句法结构是理解一个句子的意义的关键,就像 当她正在吃送达的披萨。因为 吃披萨 是如此常见的一句话,以至于我们很容易陷进错误的解译。尽管对自然语言处理的深度学习取得了新的进展,但是现存的方法仍然不足以有效处理和理解这种结构。

例如,机器智能翻译系统通常按从左到右的顺序生成词,十分容易掉入这种“花园路径”陷阱。在这个项目中,我们将开发新一代的深度学习方法,这些方法专门为发现和处理结构而设。

此外,我们希望这些系统能够被人类所理解:当他们判断翻译质量很低时,我们希望他们能提供做出此决策的原因,指出翻译错误的单词。这将使人类和人工智能更容易协同工作。

您能举出自然语言处理中最具挑战性的任务吗?

每个需要语言理解(理解是比处理更强的术语)的任务都是非常具有挑战性的。现在我们可以在语音识别方面做得越来越好了。但是我们怎么让机器理解人类并帮助他们解决问题呢? 为此,我们需要机器智能翻译(消除语言障碍)、问题解答(帮助人类寻找信息)和目标导向的对话系统(与人类更紧密地互动,解决如预订机票等的任务)。这些任务是非常艰巨的。

当这项研究在2023年结束时,您希望取得什么样的成就?

我希望有一套深度学习2.0方法,(i)它能够处理和识别语言结构,(ii)可以被人类解译,(iii)具备数据高效性,包括针对低资源语言的数据。有了这些元素,我们便可以在解决多语言交流方面其正迈出一大步!


该项目将与 UnbabelInstituto deTelecomunicações,和 里斯本大学高等理工学院(Instituto Superior Técnico)一同完成。

如果您有兴趣申请成为项目的一部分,请 在此查看完整的项目描述.

ArtboardFacebook iconInstagram iconLinkedIn iconUnbabel BlogTwitter iconYouTube icon