办事指南

Google使用神经网络进行翻译而无需转录

点击量:   时间:2017-07-27 01:04:08

Floresco Images / Getty作者:Matt Reynolds谷歌最新的机器翻译技术可以让人们更容易与那些说不同语言的人交流,通过用他们理解的语言将语音直接翻译成文本语音的机器翻译通常首先将其转换为文本,然后将其翻译成另一种语言的文本但是语音识别中的任何错误都会导致转录错误和翻译错误科技巨头深度学习研究部门Google Brain的研究人员已转向神经网络,以切断中间步骤通过跳过转录,该方法可能允许更准确和更快速的翻译该团队使用相应的英文文本对其系统进行了数百小时的西班牙语音频训练在每种情况下,它都使用了几层神经网络 - 在人类大脑上松散建模的计算机系统 - 将口语西班牙语的部分与书面翻译相匹配为此,它分析了西班牙语音频的波形,以了解哪些部分似乎与哪些书面英语相对应当它被要求翻译时,每个神经层都使用这种知识来操纵音频波形,直到它变成相应的书面英语部分 “它学会了找到源语言和书面文本中波形之间的对应模式,”加拿大蒙特利尔大学的Dzmitry Bahdanau表示,他没有参与这项工作经过一段时间的学习后,Google的系统产生了比西班牙语言更优质的英语翻译,而不是将语音转换成西班牙语它使用BLEU评分进行评估,该评分旨在根据专业人员与机器翻译的距离来判断机器翻译英国爱丁堡大学的Sharon Goldwater说,该系统对于用极少数人说的语言翻译语音特别有用例如,国际救灾队可以利用它快速组建翻译系统,与他们试图协助的人进行交流 Goldwater说,2010年地震袭击海地时,海地克里奥尔人没有可用的翻译软件 Goldwater的团队正在使用类似的方法来翻译Arapaho的语音,Arapaho是同名的美国原住民部落中只有1000名左右的人使用的语言,以及日本少数人使用的语言Ainu该系统还可用于翻译很少写下的语言,因为它不需要源语言的书面版本来产生成功的翻译 Goldwater表示,在对更大的数据集进行测试之前,很难说新方法如何与更传统的翻译系统进行比较但她认为它可以为未来的机器翻译设定标准有些服务已经使用机器翻译来让说不同语言的人实时进行对话 Skype于2014年推出了实时语音到文本翻译功能,现在支持九种语言,包括普通话和阿拉伯语以及最常见的欧洲语言但与其他现有翻译方法一样,Skype在将该文本翻译成其他语言之前将语音转录为文本文本翻译服务谷歌翻译已经在其最流行的语言对上使用神经网络,这使得它可以一次分析整个句子,以找出最好的书面翻译有趣的是,这个系统似乎使用“interlingua” - 一种在不同语言中具有相同含义的句子的通用表示 - 从一种语言翻译成另一种语言,这意味着它可以在未明确训练过的语言对之间进行转换 谷歌大脑的研究人员建议,新的语音到文本方法也可以生成一个可以翻译多种语言的系统但是,尽管机器翻译不断改进,但很难说出神经网络是如何进入他们的解决方案的,Bahdanau说 “很难理解里面发生了什么”期刊参考:arXiv,DOI:arxiv.org/abs/1703.08581关于这些主题的更多信息: