来自夜间实验室的…Unbabel之声

1 min read

在Unbabel,我们有一些名为Night Lab的项目 – 这些与公司有关的项目由人们组成的团体在空闲时间完成,每个财政季度末对这些项目投票和奖励。

自我还是个儿童以来,我着迷于手机和声音,希望有一天能开发与它们相关的系统。我认为在我自己的Night Lab 中结合Unbabel的简单易用翻译、语音识别和基于电话的API的核心业务很有意思。因此,Unbabel Voice 诞生了。

Unbabel Voice是一个自动答疑系统,它能将您会说的语言翻译成我们所支持的任何一种语言。

你拨打一个号码,告诉它你想翻译什么语言、你想把它翻译成什么语言以及你想要翻译的具体内容是什么。

然后,它会转录您的声音,将其翻译成您所请求的语言,然后再将成果交付给您。

您可以选择以短信的形式接收译文(当前暂时禁用),对于后续翻译,重复采用先前选定的语言对。

它是怎样被开发出来的

为了避免闭门造车,尽可能地缩短开发周期,我选择了借助外部服务来实现所有 复杂的 功能。这套系统使用 Twilio可编程语音 接听电话,进而调用我们的Web服务来管理当前流程,即运用 TwiML

交互式菜单可向用户索取源语言和目标语言,并由Twilio按关键字来对它们进行重新组织。初始设置完成后,设置录制内容并将要翻译的内容发送到我们的服务中,然后请求 Google Speech API 一个转录,然后发送给 Unbabel机器智能翻译API 翻译。然后,我们使用Twilio的文字转语音功能来将结果说给用户听。

由于这个项目起初是个人项目,所以,我借着这个机会深入研究了一下Web应用程序开发,我所使用的语言是 Go编程语言,也就是 Gin Web框架和其他软件包,专门用于集成使用的API。我用了 BTBurke的twiml Go图书馆 为交互式菜单生成TwiML,甚至加上 拉取请求 上游。😜

我问 索非亚罗沙 因为她精湛的设计技巧,她很快地为这个小项目制作了一个静态登陆页面,遵循我们内部设计指南,非常感谢! 🎉

结论

这是一个非常有趣的项目,我设法在一个周末左右制作一个原型。学习新技能并锻炼您的编码技能是非常有趣的事,特别是当您担任的角色为软件架构师。😅

非常感谢您阅读。请务必完成已经投入一段时间的附带项目! 😏

ArtboardFacebook iconInstagram iconLinkedIn iconUnbabel BlogTwitter iconYouTube icon