对话黄伟解读中国智能语音技术未来新时代
2020-06-07 来源:延安租房网
对话黄伟:解读中国智能语音技术未来
逆势而上,他赌一个语音交互的无先例;顺势而为,他搏一把智能愿景的新未来。
说来奇怪,语音交互这个由人类语言延展出来的物种,总因为技术高深和市场边缘被束之高阁。
黄伟和他的团队,是迷雾中的那盏灯,即便摇曳,却能从罅隙中拽出一团光亮。
难说语音交互的基础普及,但就其同时深入浅出之势,是谓解语。
编者按
黄伟,2004年毕业于中国科学技术大学电子科学技术系,专攻信号与信息处理,获博士学位。2006年获得上海交通大学生命科学技术学院博士后。毕业后任职摩托罗拉中国研究中心资深研究员,开发出世界第一款声纹认证系统。在盛大任职期间担任创新院核心高管,创建语音分院。2013年加入北京云知声信息技术有限公司,出任CEO。
Q=
A=黄伟
大而全不是做语音的正确姿势
Q:一提到语音技术,我们首先想到的是科大讯飞、Nuance,和他们相比,云知声有什么特色?
A:我们三家各有优势。Nuance是一个很专业的全球化公司,它的产品最大的亮点是多国语言的知识体系做的非常好。支持60个国家的语言,非常适合全球化厂商。他的缺点就是除了英文其他国的语音做的不是特别好,用一套引擎适应所有国家的语言,英文能做到95%,法语只能做到80%多
,中文只能做到80%多,当他在中国市场遇到科大讯飞,遇到我们的时候,性能劣势就暴露无遗了本节打了不到5分钟。
科大讯飞最早是做TTS(text to speech)的,让机器去发声,在这个技术领域里面,包括在全球来说它都是做得最好的。
云知声做语音识别是最早的,我们团队基本上都是来自于中科院,还有一些以前专业从事这方面的研发机构。我在摩托罗拉的时候,开发的语音识别引擎全球出货量累计超过两亿台,美国专利拿了八个左右,国内专利陆陆续续有三四十个,我带团队参加NIST国际语音技术评测蝉联了三次第一,我本人连续两次受邀请做主演讲人,除了我之外大陆的圈子里没有一个人上过那个讲台。所以就语音识别这个技术领域来说,我们的积累各方面比他们还要深厚。
Q:对于消费者而言,最熟悉的语音交互工具是苹果Siri,但是使用频率并不高,这是为什么?
A:Siri没有想象中的普及开来,我个人认为有几方面,第一故事太大了,大家都把Siri想象语音助理,助理应该什么都会做,什么都能做,但实际上它都做不好,希望用一个相对来说有限的人工智能解决非常开放的需求,这本身很难做到。
第二回到本原来讲,大家用这个东西不是想调侃它,而是希望接受服务,但是其实很多服务不在苹果手里。我订餐馆,你真的能帮我订到一个餐馆某个位置,帮我下菜单吗?显然做不到,那个东西反而不是技术问题,是资源整合能力,当这些都不具备的情况下,就意味着你想做的满足不了用户的需要。无论从技术还是需要两个角度,我们认为理想的方式是什么?不要大而全,垂直领域切入。
1234下一页>
威门热淋清颗粒治病原理
广西哪家医院治疗白癜风
孩子肚子疼用脐贴有用吗
黄冈白癜风好的医院