科大讯飞发布会,我看到的人工智能

唯物v 2016-12-01 01:15

11 月 25 日,讯飞还是没能打破一个“魔咒”——逢发布会股价必跌。讯飞员工向「唯物」打趣道,直播的时候有人发弹幕说,快别直播啦,去看看你们的股价吧。另'...

11 月 25 日,讯飞还是没能打破一个“魔咒”——逢发布会股价必跌。讯飞员工向「唯物」打趣道,直播的时候有人发弹幕说,快别直播啦,去看看你们的股价吧。另一名讯飞的员工则问,“这到底是什么原理呢?”实际上没人说得清楚,再加上每次股价都会反弹,所以也没人细究。

今年的发布会地点还是在国家会议中心的一层大厅,理论上这里能坐 1500 人,但今年的报名人数超过了 3500,所以现场站着听课的人不在少数,会议开始后半小时还听见门口的安保厉声道:“只让出不让进,工作人员也不行。”

总之,现场热闹非凡,人们都很想知道:在讯飞眼中,跟进人工智能的正确姿势到底应该是什么样子。

为时 4 个小时的发布会,讯飞连发了七款产品:多语种实时翻译技术、万物互联输入法、智能家居、智能车载、智慧教育、智能服务机器人,以及个性化语音合成技术。用科大讯飞董事长刘庆峰的话说:“都是绝对的黑科技。”

众所周知,在偌大的会场演示语音技术算得上一种“自杀行为”,在此栽过跟头的厂商不计其数,但在发布会当天,讯飞的每个演示都堪称完美,现场惊叹连连。甚至有那么一瞬间让人产生一种错觉,电影《Her》中的场景已经离现实不远。

多语种实时翻译技术是演示重点之一,无论是哪位演讲者登台,左右两边的大屏幕上总是实时显示他所说的每一句话(中文),准确率极高。另外,英语,日语,韩语,维吾尔族语的翻译也在实时进行。

“这不科学,”我向讯飞的员工表示质疑,“我用过你们的录音宝,机器识别的准确率基本上属于不能用的水平。”他说:“现在录音宝的识别率已经提高了不少,只不过的确还比不上现场的演示效果。”问题的关键是拾音,他补充道:“现场的演示实际上一套完整的‘讯飞听见’系统,你看不到的是,我们在台下放了 8 个麦克风。”

声学博士钱晨曾告诉「唯物」,如果想把硬件产品的拾音做好,至少需要两个麦克风以上。言外之意,麦克风的数量与拾音效果呈正相关。既然现场有 8 个麦克风作陪,那“惊叹指数”显然是要打折扣的。

另一款在现场掀起高潮的产品是被称为中英互译神器的“晓译翻译机”。演示的两人一人说中文,一人说英语,晓译翻译机几乎无延时地将对话内容互译,并用非常人性化的声音读了出来。

毫无疑问,这款产品的实用价值很高,如果复杂的对话也能达到演示的准确率——100%,晓译翻译机俨然就是一个贴身翻译。

看到这里,现场很多人心中基本上就剩下两个问题:这东西卖多少钱?什么时候上市?可惜这两个问题讯飞都没有给出答案,「唯物」能得到内部消息也只是:“还没量产,不知道什么时候上市。”

讯飞员工毫不讳言公司并不太擅长做电子消费品,并多次向「唯物」强调:“硬件是个坑。”但基于晓译翻译机的产品形态,量产的难点显然不在硬件。元器件——麦克风、芯片等——都是现成的,又没有使用特殊的造型和材料,所以最让硬件厂商头疼的定制件对晓译翻译机似乎也不成问题。合理的推测是,其软件还需要进一步优化。

换句话说,讯飞想让真正的翻译官下岗,还为时尚早。同理适用于同声传译。

真正让人想起电影《Her》的倒不是以上“黑科技”,而是这次发布会上“最不正经”的一款产品——个性化语音合成。

最开始演示时,摄像头对准了台下的锤子科技 CEO 罗永浩,老罗腼腆的笑着,和全场观众一起听着由讯飞合成的“老罗的声音”。从效果来看,合成的老罗已快逼近以假乱真的地步,所以在现场的哄笑声中,「唯物」的朋友圈也被“罗永浩为您朗读”刷屏了。

讯飞工作人员告诉「唯物」,合成只需录入一个人的数个音节,完成之后便可随意点播,欢乐程度与被录入者的可识别度,录入的音节数成正比。

在很多人(甚至包括讯飞自己的员工)看来,这只是个调节气氛的功能,但实际上,讯飞绝不会为了闹着玩研发一款新产品。

还记得在电影《Her》里男主角西奥多第一次被人工智能震惊的场景么?斯嘉丽扮演的女主角萨曼莎一发声,西奥多便感觉很诡异,他说:“你看上去就像真人,但其实只是电脑发出的声音,太奇怪了。”萨曼莎安慰他:“我能理解你作为一个正常人,在洞察力方面的局限性,你会习惯的。”

编剧的这一设定非常讲究,参考的是恐怖谷效应。斯嘉丽的表演也很出彩,并凭此片成为了罗马电影节史上首位没有一个镜头的最佳女主角。英特尔数据中心事业部副总裁、计算机架构专家、神经系统科学家 Naveen Rao 曾告诉「唯物」,《Her》是他个人最欣赏的人工智能电影。但如果没有“看上去就像真人”这一点,欣赏程度显然要大打折扣。

后记

也许是发布会耗时太久,再加上演讲者的水平参差不齐,到了发布会后半段,原本拥挤不堪的会场空旷了很多。现场的工作人员显然习惯了这种状况,各司其职数小时之后,他们依然非常兴奋。

这不是讯飞的尴尬,他们以技术立足,在业内有口皆碑,作为合作伙伴,华为消费者业务 CEO 余承东甚至缺席华为集团财年预算会议来捧场。

但我依然好奇那些目光炙热的观众是否满载而归,就像在发布会前跟我说,“就想弄明白讯飞是怎么从一家语音输入公司变成一家人工智能公司”的同事,发布会结束后他仍一脸茫然。这是个值得深究的问题,但显然,这也并不适合在这种场合讲。

招兵买马

雷锋网招人啦,加入雷锋网,分享AI时代的信息红利,与智能未来同行。阅读原文获取招聘信息与联系方式。

“喜欢就赶紧关注我们”

唯物,雷锋网旗下公众号

最新文章
猜你喜欢