“我们一直致力于让计算机听懂人说话,现在更进一步,能让手机听懂我们说话!”中科院声学所中科信利语音实验室主任颜永红给《科学时报》记者演示了用手机上网进行语音搜索——先打开百度搜索主页,对着手机说“抗生素滥用”这个关键词,找到相关新闻4万多篇。
早在9月2日,该实验室与百度公司合作研发的这套语音搜索软件已经在百度世界2010大会上亮相。
在计算机技术和互联网技术日新月异的当下,随时随地获取信息成为人们的诉求。利用手机进行互联网信息搜索成为最优选择。但由于手机输入文字不方便,使得搜索需求很难满足。而语音搜索,为人们尤其是老年人、盲人提供了一种便捷的手段,只要用语音说出自己想找的内容,例如“工商银行中关村支行”,就可以便捷地查找到相关信息。
据报道,谷歌8月13日在旧金山举行的新闻发布会上表示,美国市场采用Android 2.0系统的设备中,有1/4的搜索是通过语音搜索功能完成的。这充分说明了语音搜索的巨大市场需求。
现在,你想找一首歌,但忘记了歌名、歌词,不要紧,哪怕只记住其中一小段旋律,打开百度MP3网页,可以通过哼唱的方式,搜索到自己想要的歌曲,给人一种别具一格的体验。
总之,语音搜索和哼唱搜索为人们获取互联网信息提供了方便的人机交互手段。
“这套语音搜索和哼唱搜索软件研发的速度非常快,我们是5月份开始做,两个月的时间搞定,两个月内测,9月份百度正式向外发布。”颜永红表示说,研发速度快主要是该实验室在语音搜索方面有深厚的技术积累。实验室提出基于声学层、符号层、乐句层3层旋律表示的哼唱检索方法和框架;基于全新的自上而下匹配框架,提出递归对齐算法和局部对齐修正算法;语音识别技术在国内评测中多次获得第一名,音乐检索技术在世界音乐搜索组织(MIREX)评测中于2006至2009年连续取得第一的成绩。
语音搜索,一方面可以深入开掘企业既有的信息资源,另一方面又创造了新的搜索经济,成为电信运营商和互联网企业共同的猎物。未来,语音搜索也必定会是搜索引擎争夺的“高地”。相关企业势必在重点区域的精品业务上精耕细作,从而推动产业链的蓬勃发展。
颜永红透露说,实验室与百度公司成立了联合实验室,这是百度首次与中科院建立联合实验室。通过联合实验室,双方在语音搜索和哼唱搜索方面将建立长期战略合作关系,双方将联合研发相关的核心技术,并应用于实际产品平台,“我们希望能直接带动国内语音搜索技术和互联网、移动终端、电信运营商、移动电子商务、音乐媒体等相关产业的发展”。
颜永红还兴奋地告诉《科学时报》记者,中科信利语音实验室已经被评为中科院重点实验室,成立9年来,“十五”到“十一五”期间,经费增长了8.89倍,人数增长了2.75倍——从6人发展到现在的102人,合作名单中都是微软、英特尔、索尼、华为、中国电信等这样的大企业。