Follow us
首先要把演讲者的英文语音识别成文字

同声传译

最近几天,翻译圈子里的焦点是国内某所谓的科技巨头被指在魔都某会上用人工同声传译假装机器同声传译,以示自己的AI同传多牛X,事情的来龙去脉不清楚的小伙伴,自行百度下,这里不再赘述。作为翻译圈子混了十几年的小编,来八卦下AI同传到底靠不靠谱。


首先讲下AI同传需要什么技术:


一、语音识别技术:因为是土鳖公司,这家公司的中文语音识别技术还可以,又因为是土鳖公司,这家公司的外语识别技术就呵呵呵了。


要实现AI英中同传,首先要把演讲者的英文语音识别成文字,这一步的准确率特别重要,如果这一步都做不好,下面的机器翻译就更扯淡了,那现场的语音识别结果又是怎样的呢,参会者是这样描述的:英文的語音辨識自動顯示了讀音差不多的詞,但正常人並無法看懂這段「英文」到底是什麼。漢譯英譯文中有「Davos Forum」(世界經濟論壇:因每年在達佛斯舉辦,俗稱達佛斯論壇)這個詞的時候,螢幕上寫的是「Devils Forum」(魔鬼的論壇)。


看到这里又该呵呵了,这家公司的英语语音识别技术就是渣,哪里来的AI同传。


二、神经网络机器翻译技术(NMT)


语音转成文字以后,下面用的就是神经机器翻译,说到神经机器翻译,不得不说一说open nmt,Open Nmt是哈佛大学自然语言处理研究组(Harvard NLP)研发的神经机器翻译系统 OpenNMT,该系统使用了 Torch 数学工具包。该研究组在官网上表示该系统已经达到生产可用的水平(industrial-strength)。更更重要的是opnmt是开源免费的哦,Github可以下载到,不知道国内这些所谓的巨头们敢不敢把自己的底裤拿出来show一下,哪家没有用Opennmt,说到这里,小伙伴们清楚高大上的人工智能机器翻译谁家牛了吧,不是蓝翔哦,是FANNG(facebook,Amazon,奈飞,Google等)。现在FANNG的机器翻译还不能直接商用,要用的话是机译加PE,文档翻译是基于原文完全正确的情况下,效果还不是很好,那这家科技巨头识别的词不达意的英文,交给NMT能翻译出什么呢?吹牛自己商用,这不是侮辱我们的智商吗?


可能有朋友会问,既然open NMT 完全公开免费,那么不是谁都可以有机器翻译引擎了,理论上是可以的,但是,要训练优质的机器翻译引擎,必须需要高质量的语料,这也是现在巨头们收购传统翻译公司的原因。说到这儿,这也是这家公司为什么英语语音识别不可能识别好的原因,他没有足够的英语语音资源来训练自己的语音识别引擎。


三、TTS(文字转语音)技术:


TTS技术这里不再多说啦,有兴趣的小伙伴们可以百度下,IBM搞了几十年的技术了,已经非常成熟了。


联系乾坤彩票

电话:
0701-22891057
24X7服务热线

邮件

欢迎随时发邮件给我们
tavotcvdnv@sohu.com,
and we’ll get back soon.

我们的地址

中国上海
中国(上海)自由贸易试验区,
达尔文路88号