使用 PPT 实现在线语音翻译转文字
之前介绍过谷歌旗下的实时语音转文字软件——Speechlogger ,依靠自家的 AI 引擎进行语音识别,对背景不复杂,语速中等的语音有着不错的识别效果。
这次,青年君给大家介绍另外一款语音转字幕插件——Presentation Translator ,以下简称 PT 。
PT 的出身同样有来头,它是微软推出的演讲实时翻译字幕软件,正儿八经的 PPT 插件。
插件的使用场景设定在有着多语言观众的演讲现场。比如,某新品发布会上,演讲者用中文解说 PPT,而台下的观众来自五湖四海,他们并不能很好理解中文。
这时候,演讲者的解说需要一个同声翻译来传达他的意思,PT 插件就是这个和“同声翻译”起着相同作用的解说器。
当然,如果你想让它为你的演讲生成相同语言的字幕,这也是可以的。说了这么多,我带大家一起玩玩这个插件。
插件的安装和使用可以点击「阅读原文」查看,今天只对插件的识别和翻译能力进行测试。
插件可以在官网免费下载。在PPT 中,插件的面板被安排在「幻灯片放映」选项卡下面的「Microsoft Translator」组。
如果我们仅仅想借用这个插件来实现麦克风语音输入转文字,或者是本地音视频转文字,那么你只要随便新建一张幻灯片就OK哒。
今天准备了四段素材,分别是慢速英文语音、普通话和英文混合语音、台湾腔中文语音和中等速度的普通话语音。
首先我们需要点击「启动字幕」按钮,并在弹出的对话框中选择相应的语言,一般来说,你的电脑没有外接麦克风,「麦克风」就只有唯一的选项。「其他设置」中可以调整一些自定义内容。
一切就绪,我们「启动字幕」。
根据电脑的配置不同,软件计算的时间不同,如果你只是新建了一张幻灯片,那么基本会是秒开。整张幻灯片将进入到放映的模式,当然这是为演讲者设计的,我们可以按【ESC】退出幻灯片放映。
我简单解释一下 PT 插件的界面。
一串地址的位置,点击后会弹出一张QT二维码。手机上装有「微软翻译」APP的同学,可以用「加入会话」功能同步电脑端的文稿,方便观众通过手机就能够看到演讲者的内容。
三个省略符号内「保存记录副本」可以很方便的将我们的文稿导出成 .TXT 格式。另外,静音开关可以让插件暂时接收不到来自麦克风或者声卡的信号。
我们从难度最低的慢速英文开始。
从动图中可以看到,插件基本可以胜任慢速英语,翻译结果会在语音断句后才显示,文稿显示稍微延迟。不过,这对于正常演讲,也是够用的。
我们升级难度,播放一段中等速度的普通话。
PT 插件每一次设置只能识别一种语言的演讲,为了测试,我们需要重新「启动字幕」,并设置好语言。
识别的结果:
总结四个字:惨不忍睹。PT 完全无法胜任中等速度的语音。
我们再看看台湾腔调的中文语音。
识别的结果:
总结两个字:勉强。PT 识别出来的结果还是能看懂,涉及到一些专业术语,PT 也无能为力。
最后,我们用一段普通话和英文的混合语音来结束今天的玩耍。
本篇文章来源于微信公众号: 两伙青年