谷歌开发AI“读唇”软件,测试结果如何?谷歌人工智能部门DeepMind正与牛津大学研究人员合作,希望开发出全球最先进的“读唇”软件,可能比人类的“读唇”能力还要出色。
为实现这一目标,研究人员选取了数千个小时的BBC电视短片,上传到一个神经网络上,对其“读唇”软件进行训练,即根据主播嘴部运动来识别其播报内容。
谷歌开发AI“读唇”软件 测试结果如何
结果,这款“读唇”软件的唇读准确率高达46.8%。相比之下,基于同样的测试内容,人类唇读的准确率只有12.4%。
这项研究基于牛津大学之前的一款人工智能“读唇”系统“LipNet”。LipNet能将视频中人物的嘴部运动与其台词进行匹配,准确率高达93.4%。当然,该准确率主要基于一些相对简单的句子。
DeepMind这款“读唇”软件名为“看、听、分析与拼写”(Watch, Listen, Attend, and Spell),与LipNet不同的是,DeepMind的软件致力于更难的长句。
为此,谷歌神经网络观看了来自BBC的约5000个小时的流行电视节目,包括《晚间新闻》和《提问时间》和《今日世界》等,共包含了11万个不同的句子,1.75万个不同的单词。相比之下,测试LipNet的句子只包含了51个不同的单词。
谷歌开发AI“读唇”软件 测试结果如何
谷歌对此表示:“这项研究的目的是识别人们谈话时的短语和句子,有声音或没有声音都能识别。与之前的相关研究不同,它们仅限于有限数量的单词或短语,而我们的研究针对无限制的自然语言长句。”
DeepMind团队认为,他们新开发的这款软件除了能帮助听力损伤人群,还支持其他一系列应用,包括注释电影、利用唇部动作与Siri和Alexa等数字助理通信等。
文章转载于腾讯科技。
标签:“读唇”软件
为您推荐
苹果决定不再公开广告开支数据,富国银行如何看待该行为?苹果在10月提交给证券交易委员会的最新年报只字未提广告开支。
caoshanshan2016-11-25 09:10
马斯克也沦为假新闻受害者,被记者称为“国家耻辱”。据外媒报道,作为一位专业“破坏者”,埃隆·马斯克(Elon Musk)可谓树敌无数,这让他在网络上招来了许多批评者。不过这一次,情况有些不同,因为这位批评者伪装成了一位手法高超的记者。
zhengmingyue2016-11-25 09:08
瑞士研制新存储设备,硬币大小竟能容下100TB。前阵子有硬盘厂商发布8TB超大容量硬盘让很多喜欢存储的朋友欣喜不已,而近日瑞士物理学家成功研制出了新的存储设备,能够实现每平方英寸115TB的存储密度。目前这个设备还处在原型阶段,正式商用估计还有很长的路要走。
zhengmingyue2016-11-25 08:58
诺基亚要想在手机行业再称王,达到5点便不会被遗忘。科技媒体AndroidAuthority近日撰文称,经历了过去几年的起起落落,诺基亚明年终于要再次回归智能手机市场了。虽然如今的诺基亚已经是HMD公司借壳生的蛋了,但情怀指数超高的它依然会圈来不少死忠粉。因此,拿着一手好牌,HMD能不能漂亮的打出去就成了诺基亚能否王者归来的关键。
caoshanshan2016-11-25 08:50
苹果不再披露广告支出,或为掩饰销售额背后的支出增长。据外媒报道,富国银行分析师称,苹果在其最新10-K年报中不再披露广告支出,转而将它纳入了涵盖面更广的“销售、总务以及管理支出”(SG&A)中。而在此前,苹果一直单独披露广告中的支出。
zhengmingyue2016-11-25 08:46
苹果占全球智能手机利润的91%,这究竟是为什么?一项来自美国研究机构的报告显示,截至2016年三季度,全球智能手机市场的总利润达到了90亿美元,其中91%的份额被苹果手机获取。这意味着总销量仅占一成的苹果手机,却获得了全球九成的利润。
zhengmingyue2016-11-25 08:42
张亚勤加入百度挑战严酷,李彦宏欲成为下一个谷歌。张亚勤离开微软,在很多人心目中,其实只是一个时间问题。
xuheng2016-11-24 17:55