• OA系统
  • 图书馆
  • English
  • 中国科学院
  • 首页
  • 所况简介
    所况简介
    1964年,为落实国家声学规划,满足国家迫切需要,形成全国声学学科研究中心,经国务院副总理聂荣臻元帅批准,成立中国科学院声学研究所(以下简称声学所),将原中科院电子所的水声、超声、建筑声3个实验室,1958年成立的南海研究站、1960年成立的东海研究站、1961年成立的北海研究站整体纳入声学所。声学所是从事声学和信息处理技术研究的综...
    了解更多+
    现任领导
    李风华
    所长
    库卫群
    党委书记、副所长
    李明庚
    副所长(正局级)
    杨 军
    副所长
    杨 波
    副所长
    王 雷
    纪委书记
  • 机构设置
    领导机构
    所务会 党委会
    咨询机构
    学术委员会 学位评定委员会
    职能部门
    综合办公室 党委办公室 人力资源部 科技发展部 重大任务部 财务管理部 资产条件保障部 质量管理部 保密办公室 监督审计(纪委)办公室 造船办公室

    研究站
    南海研究站 东海研究站 北海研究站
    挂靠机构
    中国声学学会 全国声学标准化委员会 中国科学院声学计量站(CMA)
    研究单元
    声场声信息实验室
    水下环境信息感知实验室
    水下信息技术实验室
    海洋声学技术实验室
    水下航行器实验室
    超声学实验室
    噪声与音频声学实验室
    智能网络与信息处理技术实验室
    语音与智能信息处理实验室
    无人信息系统研究中心
  • 科研成果
    研究领域
    经过五十多年的发展,声学所形成了独具特色的六大研究领域:水声物理与水声探测技术、环境声学与噪声控制技术、超声学与声学微机电技术、通信声学和语言语音信息处理技术、声学与数字系统集成技术、高性能网络与网络新媒体技术。 【详情】
    成果概况
    获奖
    论文
    专利
    专著
    科研进展
    研究人员提出一种基于声阻抗效应的声表面波气体传感新方法
    2025-02-14
    声学所极地声学研究取得突破性进展
    2025-01-23
    研究人员在蜂窝结构中发现反常声传播特征并展示其在脱粘缺陷检测中的潜力
    2025-01-16
    声学所论文被评选为“2024年度中国高影响力数据论文”
    2024-12-11
    声学所王文团队论文获得Nature子刊2024年度热点论文奖
    2024-10-21
    中国科学院声学研究所语音与智能信息处理实验室团队在EUSIPCO 2024 LAP Challenge中夺冠
    2024-09-12
    研究人员提出面向网络加速的FPGA动态部分可重构方法
    2024-09-03
    研究人员提出逐符号运动补偿的256QAM水声通信方案
    2024-08-16
    研究人员提出基于深度学习的地层横波速度层析成像新方法
    2024-07-23
    研究人员利用零群速度特征提出一种复合蜂窝结构脱粘缺陷检测新方法
    2024-07-02
    研究人员提出适用于MIMO系统的目标检测与位置估计方法
    2024-06-03
  • 人才队伍
    院士专家
    汪德昭
    马大猷
    应崇福
    张仁和
    侯朝焕
    李启虎
    汪承灏
    人才招聘
    更多+
    中国科学院声学研究所2025年特别研究助理(博士后)招聘启事
    2025-04-03
    中国科学院声学研究所2025年招聘启事
    2025-04-03
    中国科学院声学研究所资产条件保障部岗位招聘启事
    2025-03-18
    中国科学院声学研究所诚邀优秀青年人才申报2025年度海外优青项目
    2025-03-03
    中国科学院声学研究所监督审计(纪委)办公室管理岗位招聘启事
    2025-03-03
    正高级专业技术岗位
    副高级专业技术岗位
    中科院青年创新促进会会员
    特别研究助理及博士后管理
  • 研究生教育
  • 党建与文化
    活动报道
    更多+
    声学所党委举办深入贯彻中央八项规定精神学习教育读书班暨理论学习中心组集体学习会
    2025-06-04
    声学所开展弘扬科学家精神专题培训
    2025-05-23
    重温红色历史 铸就奋进初心——记中国科学院声学研究所离退休党员参观党史馆
    2025-05-21
    语音与智能信息处理党总支开展“严明岗位工作纪律”主题党日
    2025-05-21
    水下环境信息感知党支部举办“传承与拼搏”系列微党课活动(十)
    2025-05-19
  • 交流合作
    学术交流
    更多+
    声学所特别研究助理小组举办2025年度第2期学术交流活动
    2025-05-26
    声学所举行2025年第6期学术交流会
    2025-05-26
    声学所举行2025年第5期学术交流会
    2025-04-15
    声学所举行2025年第4期学术交流会
    2025-04-15
    声学所举行2025年第3期学术交流会
    2025-04-02
    科技合作
    更多+
    科技导报社调研声学所
    2025-03-10
    青岛市人大代表慈国庆参加市人大代表座谈会
    2024-03-27
    青岛高新区工委委员、管委副主任张建军调研北海研究站
    2023-12-04
    超快速高灵敏声表面波氢气传感器入选中国科协科研仪器优秀案例
    2023-03-28
    科技部社会发展科技司调研声学研究所相关工作
    2023-03-23
    国际会议
    更多+
  • 科学传播
    工作动态
    更多+
    科学之"声" 启迪未来——中国科学院声学研究所成功举办第二十一届公众科学日活动
    2025-05-20
    我们的耳朵——中国科学院青促会北京分会 “爱科学小课堂”第 23期科普活动在声学所举行
    2024-09-10
    北京市中关村中学走进北海站开展科学实践活动
    2024-07-15
    《中国医学影像技术》5T专刊在京发布 国内首次系统性地在学术期刊上介绍和展示世界首创的超高场5T磁共振技术
    2024-06-28
    声学所作品获评2023年度全国优秀科普微视频
    2024-04-01
    科技期刊
    科普文章
    更多+
    科普文章丨耳机里的声音为什么会有方向感?
    科普文章丨嘿,siri!嘈杂的酒吧里,AI为什么听不懂指令?
    科普文章丨神奇的主动降噪技术
    科普视频
    更多+
    科普视频丨杨波:揭秘“深海勇士号”载人潜水器
    科普视频丨声音的奥秘
    科普视频丨真空无法传声科普实验
    科普视频丨借声波一臂之力探神秘海底世界
  • 信息公开
    信息公开规定
    信息公开指南
    信息公开目录
    信息公开申请
    信息公开年度报告
    信息公开联系方式
  • 首页
  • 所况简介
    • 机构简介
    • 所长致辞
    • 现任领导
    • 历任主要领导
      • 历任所长
      • 历任党委书记
    • 院所风貌
  • 机构设置
    • 党的委员会
    • 学术委员会
    • 学位评定委员会
    • 组织机构
      • 领导机构
      • 咨询机构
      • 研究平台
        • 研究单元
        • 重点实验室(工程中心)
      • 职能部门
      • 研究站
      • 挂靠机构
  • 科研成果
    • 研究领域
    • 科研进展
    • 科研产出
      • 获奖
      • 论文
      • 专著
      • 专利
  • 人才队伍
    • 院士专家
    • 正高级专业技术岗位
    • 副高级专业技术岗位
    • 中科院青年创新促进会会员
      • 2011
      • 2012
      • 2013
      • 2014
      • 2015
      • 2016
      • 2017
      • 2018
      • 2019
      • 2020
      • 2021
    • 特别研究助理及博士后管理
      • 博士后公告
      • 博士后规章
    • 人才招聘
  • 交流合作
    • 学术交流
    • 国际会议
    • 科技合作
      • 合作动态
      • 专利转让信息
      • 合作项目
  • 研究生教育
  • 党建与文化
    • 党群园地
    • 组织文化
    • 形象标识
    • 活动报道
    • 文化副刊
      • 诗歌
      • 书画
      • 摄影
      • 散文
  • 科学传播
    • 时间轴
    • 工作动态
    • 科普作品
      • 科普文章
      • 科普视频
      • 其他
    • 科技期刊
  • 信息公开
    • 信息公开规定
    • 信息公开指南
    • 信息公开目录
    • 信息公开申请
    • 信息公开年度报告
    • 信息公开联系方式
  • 重要新闻
  • 党建动态
  • 综合新闻
  • 媒体报道
  • 学术报告
  • 通知公告
  • 最美科学家
  • 专题
  • 专题
    • 深切缅怀汪承灏院士
      • 讣告
      • 汪承灏院士治丧委员会
      • 生平传记
      • 追忆悼念
      • 科研成果
      • 科学家精神
      • 音容笑貌
    • 深入贯彻八项
    • 2025年全国两会
    • 学习贯彻党的二十届三中全会
    • 科技自立自强之路
    • 科学家精神教育基地
    • 2024年全国两会
    • 平语近人(第3季)
    • 中国科学院2024年度工作会议
    • 科技创新再出发
    • 学习贯彻习近平新时代中国特色社会主义思想主题教育
    • 学习两会精神
    • 学习宣传贯彻党的二十大精神
    • 中国科学院2022年度工作会
    • 2021年终科技盘点
    • 中国科学院“基础研究十条”
    • 十九届六中全会
    • 党史学习教育
    • 不忘初心牢记使命
    • 率先行动
    • 两学一做
    • 防灾减灾
    • 十八届四中全会
    • 喜迎十八大
    • 十九届五中全会
  • 快捷通道
    • OA系统
    • 继续教育网
    • ARP
    • 违法违纪举报
    • 信访渠道
    • 图书馆
    • 正版软件
    • 网站地图
  • 友情链接
    • 新闻媒体
    • 政府机构和组织
    • 国内院校
    • 国内科研机构
    • 国际科研机构
  • 网站纠错
媒体报道
您当前的位置:
首页 媒体报道

颜永红:“搜索”语音识别的未来

发布时间:2010-05-28 作者:转载自科技日报 操秀英
【  小 中 大  】

 

——人物档案——

颜永红

中科院声学所中科信利语音识别实验室主任。

1990年毕业于清华大学,1995年获得美国俄勒冈研究院博士学位,后在该校任教,曾担任OGI口语研究中心的副主任、英特尔微处理器实验室的主任工程师和人机界面总框架师,英特尔中国研究中心的主任和首席研究员,英特尔全球人机界面学术委员会主席。

2002年任声学所研究员、博士生导师,中科信利语音实验室主任和所长助理。长期从事人机界面研究工作,目前从事的研究领域:大词表非特定人连续语音识别,多模口语系统,嵌入式系统,多媒体数据检索,系统自适应和快速搜索算法。

在不久的将来,互联网将成为一个浩大的音视频档案库,对下一代搜索引擎来说,语音识别技术是关键。

10年前,他曾是英特尔微处理器实验室的主任工程师和人机界面总框架师,英特尔中国研究中心的主任和首席研究员。

如今,他一手创办的中科院声学所中科信利语音识别实验室已发展成为国内语言声学领域规模最大、学科最全的实验室,与实验室同时成立的中科信利技术有限公司也取得了长足的发展。

两个“孩子”的长大让他倍感欣慰。而同时,他错过了两个宝贝女儿的成长,这是他最遗憾的。

“没有什么后悔的,时间无法倒流,只能往前看。”中科院声学所中科信利语音识别实验室主任颜永红说。

一项技术,牵制搜索引擎

“在不久的将来,互联网将成为一个浩大的音视频档案库,对下一代搜索引擎来说,语音识别技术是关键。”颜永红说。

在浩繁的音视频数据库中,要查找出所需的音视频片断,已经成为困扰互联网搜索的难题——目前的技术主要是搜索音视频的关键词,比如音视频的名字或作者,并没有办法搜索音视频内容。而通过语音识别技术,可以把多媒体文件变成可识别的计算机语言,从而有效快速的实现准确搜索。

事实上,语音识别技术也是各大公司竞争的一大焦点。

去年11月份,谷歌推出的语音搜索引起极大关注。用户只需在手机上安装一个软件,然后利用手机原有的麦克风,用普通话对手机说出需要查询的内容,谷歌中文语音搜索会自动返回整合的搜索结果。

“从实验室成立到现在,我们一直在做这方面的技术积累,很快,我们和国内公司合作的语音搜索将面世。”颜永红笑着说。

目前,中科信利的中文电视广播新闻节目识别系统,就已经被多家公司采用,并作为其提供给全国各电视台的数字媒体管理系统中一个核心技术模块。

这个系统立刻引起本报记者的强烈兴趣——当系统“收听”到一段“新闻联播”节目,自动将节目内容生成文字,并且识别准确率惊人地高。

“那是不是我们的采访录音直接可以被转化成文字?”记者顿时兴致勃勃。

“现在还不行。”颜永红笑着说,“因为语音识别包括语言模型和声学模型,新闻语言可以建立语言模型,但口语却很难建立语言模型。”

在语音识别实验室里,视频精确搜索已不是问题。

在一段王楠比赛的视频中,你只要输入“侧身抢拉”、“前三板”等关键词,就可以找到精确到秒的视频。这就意味着,如果你想找一部电影里的精彩片段,只需记得其中的经典台词即可搜索。

两块牌子,连起创新链条

颜永红记得,语音实验室获得的第一笔项目经费来自科技部863项目2003年语音识别领域的比赛。“我们的识别率是最高的,获得了20万元的项目。”

如今,上千万的课题在这里已不是新闻。他领导的这个年轻的团队,已获得授权发明专利22项;软件著作权登记36项;有30余项发明专利正在审查中;在国内外各种学术会议和刊物上,已经发表了200多篇学术文章。

中科信利技术有限公司在业内也小有名气,人们将他看成颜永红的“著作”之一。

事实上,8年前,公司的成立仅仅是给科研人员“画了个饼”。

“科研人员不会成为富翁,但是至少应该体面地工作、体面地生活,所以,成立一个公司,让大家研发出来的技术有一个走出去的载体,这就是田静所长和我当时的想法。”颜永红说。于是,在只有100多万元启动资金的情况下,中科信利成立。

万事开头难。“公司前几年都没有收入,最困难的时候甚至濒临倒闭了。”说这话时,颜永红是微笑的,但笑容背后的艰辛是旁观者无法体会的,而他也不愿多言。

峰回路转,中科信利等到了第一次商机。其研发的产品嵌入式语音软件被应用在了手机上,这就是大家比较熟悉的语音拨号。

“有些人的手机里存了几百上千个电话号码,找起来很麻烦,安装这一软件后,只要对着手机叫出对方名字,即可调出他的资料。”颜永红介绍道。

这个嵌入式语音软件支持语音拨号、命令控制、来电短信提醒、语音读出短信、连呼数字拨号等功能。此外,他们还开发出基于分布式集群架构的语音处理平台TSE。

“在此之前,电信级语音识别引擎技术完全被美国公司垄断,但现在我们完全有底气说,我们占据了大半壁江山。”言至此,颜永红的语调高了很多。确实,在国内,真正能够将语音识别产品拿出来,放在电信网上规模使用的,也只有中科信利。

语音实验室承担着国家科研任务,中科信利公司开发语音技术产品,这两个牌子的作用互为配合,相得益彰。颜永红介绍说:“实用技术的推广应用,不是所有实验室的人员能够胜任的事情。在科技创新的整个链条上,我们分为概念产生、原理研究、原理性样机研制、产品化、市场推广,总共为五个阶段。语音实验室基本承担前三段,后两段则由中科信利技术有限公司完成。”

“十一五”期间的策略是由公司支持实验室,而“十二五”期间,需要大力发展公司。颜永红说:“下一步我们需要积极探索,怎样通过发展公司带来更多机会,打破实验室发展的瓶颈。”

——— 学生印象 ———

他已经过了要勤奋的年纪,但对他而言勤奋已成为一种态度

对于成绩的取得,颜永红反复说:“多亏了中科院和声学所领导,以及各方面的关心支持。”

而在许多人看来,更为重要的或许是他身体力行的“拼命三郎”的精神——早上不论多早,晚上不论多晚,人们都能在语音实验室的大楼看见他忙碌的身影。

董滨是颜永红培养的第二位学生,2006年博士毕业后他进入一家日本企业的研究机构工作,但一年后他选择回到实验室。“颜老师给我最大的影响是勤奋。”想了想,他又说道,“应该叫敬业吧,勤奋用来形容他似乎不太合适。”

也许在学生看来,颜老师已经过了要勤奋的年纪。但对于颜永红自己而言,勤奋早已成为一种态度。

前几年,颜永红是大家公认的“来得最早,走得最晚的人”。而现在,他不得不承认:“精力不如从前了,来得最早还能做到,但已经不是走得最晚的人了。”

但他对学生的第一要求依然是勤奋。

“面试研究生时,我一般都问两个问题:你想达到什么样的目标,你是否足够勤奋。这两个问题可不是那么好回答的,它是用接下来几年时间去验证的。”颜永红说。

“我觉得自己这个导师当得还行,这几年我培养的9名博士生中,有4个拿到了中科院的院长奖励,一位是院优秀毕业生,两位是‘微软学者’。”对于颜永红来说,这个成绩单显然比研发出任何一种新技术更重要。

——— 儿女情长 ———

和科研团聚,与家人分离

2002年11月,一则新闻让颜永红走进公众视野:曾任英特尔中国研究中心主任、首席研究员的颜永红,和他麾下的6位科研人员,先后集体“跳槽”,来到中科院声学研究所,组建中科信利语音实验室。

甚至有媒体以这一事件为切入口,来讨论跨国企业的用人战略调整等等。

这么大的动静或许是颜永红没想到的。

其实早在2001年4月,颜永红就离开英特尔中国研究中心,回到美国俄勒冈研究院工作了一段时间。“因为我太太和孩子都在美国,声学所田静所长当时和我谈的是每年回国工作3个月,后来事情太多,我自己就基本上全年都在国内了,所以说,我是一步一步走回来的。”颜永红颇有些调侃地说。

2004年6月份,当他在俄勒冈研究院的博士生毕业离校时,颜永红也正式辞职回国。

他的太太和两个女儿,至今还生活在美国。“孩子们在那里出生长大,估计很难适应国内的教育强度。”颜永红说。

这8年里,他经历了酸甜苦辣。最苦的莫过于对妻女的思念。“我回国的时候大女儿6岁,小女儿4岁,一个父亲,错过了孩子成长中最关键的时刻,这是我这辈子都没办法弥补的遗憾。”颜永红轻声说,“每次我从美国回来的前一天,都能感觉到她们的情绪很低落,出门的时候真的很心酸。”

好在有了视频聊天,“至少现在我每天都能看到她们了。”每天早上7点钟,只要不开会,颜永红到办公室的第一件事就是上网和她们聊天,因为这个时间刚好是美国波特兰下午三点钟女儿们放学回家的时候。

 
 
 
 

附件下载:

上一篇:

科学时报 马大猷:从没后悔自己的选择

下一篇:

国内首台声相仪问世

新闻媒体
  • 新闻媒体
  • 人民网
  • 新华网
  • 光明网
  • 央视网
  • 中国科技网
  • 科学网
政府机构和组织
  • 政府机构和组织
  • 中国政府网
  • 科技部
  • 财政部
  • 工业和信息化部
  • 国家自然科学基金委
  • 国家发展改革委
  • 中国科协
国内院校
  • 国内院校
  • 中国科学院大学
  • 中国科学技术大学
  • 哈尔滨工程大学
  • 南京大学
国内科研机构
  • 国内科研机构
  • 中船重工
  • 地科院
  • 医科院
  • 铁科院
国际科研机构
  • 国际科研机构
  • 美国声学学会
  • Scripps海洋研究所
  • 哥本哈根大学
  • 勒芒大学
旧版回顾 | 网站地图 | 联系我们
© 1996 - 2021 中国科学院声学研究所 版权所有备案序号:京ICP备16057196号-1
京公网安备110402500001号地址:北京市海淀区北四环西路21号中国科学院声学研究所
邮编:100190
官方微信