“回国12年来,有过失落,有过委屈,更多的是做事的成就感。”
从2002年回国孤身一人,到带领130多人的团队;从白手起家,到与腾讯、百度和阿里巴巴等互联网企业合作开发民用软件;其学术论文单篇他引数高达180多次。
颜永红,中国科学院声学研究所研究员,中科信利语音实验室主任,2009年获得国家自然科学基金委的“国家杰出青年基金”。
推进标准的改变
“几个人,一个小摊子,弄不成大事。”面对《中国科学报》记者的采访,颜永红对自己的中科信利语音实验室有些自豪——100多位科研人员和30多位硕士、博士,其中包括12名海归,可谓是“语音方向最大的国立研究单元”。
2010年,中科信利语音实验室升级为中国科学院重点实验室。
在基础研究方面,颜永红团队试图作出原创性的成果。2011年,在国际顶尖声学期刊The Journal of the Acoustical Society of America 发表了《多语言对语音信号处理的影响》。“主流语音信号处理算法针对的是英语,而汉语的处理方法会有大的调整,这是原理上的重大革新,进而将推进标准的改变。”颜永红介绍。
团队成员李军锋告诉《中国科学报》:“论文发表后,美国斯达克助听器公司找到我们,希望与我们合作研发针对中文及其中国市场的算法。”历经2年的合作研发与测试,这家助听器公司将于今年底之前在中国推出更有效的助听器。据不完全统计,中国2015年将有2.6亿60岁以上的老年人和70万左右0~18岁听障儿童。“全球有6大助听器公司品牌,都是英语算法,基于中文算法的民族品牌很少。”李军锋说。
“这个工作的社会效益远远大于经济效益,可谓是‘雪中送炭’。”颜永红说。
合作全面开花
颜永红团队和中科院新疆理化所合作开发的“维汉双语教学软件”对推动新疆双语教学工作具有“革命性”和“开创性”的作用。截至2013年7月,在和田、喀什、阿克苏、乌鲁木齐等地14个县市200多所学校的2100多个双语班级的课堂教学中进行应用,取得了很好的应用效果。同时开通了“新疆双语教学”网站,通过网络面向全疆双语师生提供7天24小时双语教学服务。
这几年,颜永红团队与各方的合作更是“全面开花”。
在声源定位、语音增强方面的“麦克风阵列”技术已经与北京中星微电子有限公司和山东共达公司合作,小批量生产芯片和远讲阵列。
除此,团队还与百度合作推出第一个语音搜索,目前,语音搜索占总搜索流量的10%以上。
2013年,他们与阿里巴巴合作推出智能客服,服务于“双十一”“双十二”购物节蜂拥而至的订单,正确转单率为80%,与人工坐席的水平一致。
“此外,我们还与腾讯搜索、UC歪歪聊天、金山词霸等互联网企业合作;与长虹电视、TCL等家电企业合作。在智能时代,语音处理的民用市场是很大的。”颜永红说,早在6年前他就看出智能家电的应用将是个爆发点,而了解颜永红实力的宏威公司找上门来,合作开发芯片。
“在智能时代,无论手机、IPTV、家用电器,还是汽车、可穿戴设备,语音操作一定是重要的方式。”颜永红说,假以时日,基于语音操作的科技产品会有更大的市场和更广阔的用途。
“杰青”是很大的肯定
颜永红2009年凭借《面向语音处理的言语声学数字化建模》成功申请到国家自然科学基金委员会数理学部的“国家杰出青年科学基金”。“钱不多,但是对我本人、对我们团队都是一个很大的肯定。”
1997年,颜永红30岁时当上排名全美前三的口语研究机构俄勒冈研究院OGI—CSLU的副主任,31岁成为终身教授,32岁创办英特尔中国研究中心,曾担任中心主任和首席科学家。注重国际交流与合作是他的特质,与美国高通公司、霍尼韦尔国际(Honeywell International)等合作开展基础研究,前者开发CDMA,市值超过IBM,后者是营业额达380亿美元的多元化、高科技的先进制造企业。
《中国科学报》记者采访到的团队成员李军锋、董滨和付强都坦承,颜永红做事一丝不苟、关注细节。
研究之余,颜永红还向团队成员推荐维克托·迈尔·舍恩伯格著作的《大数据时代》。“舍恩伯格是最早洞见大数据时代发展趋势的数据科学家之一,他的书能让我们了解大数据在商业时代的应用。”颜永红说。
声学研究所曾根据声学事业的奠基人、声学家马大猷先生的教诲将组织目标定位为“国家的声学所、国际的科学家”,颜永红将研究区别于传统的纯声学领域,开拓出“人的音频”等新阵地。而这块新阵地,在智能时代可谓是潜力无限。