• OA系统
  • 图书馆
  • English
  • 中国科学院
  • 首页
  • 所况简介
    所况简介
    1964年,为落实国家声学规划,满足国家迫切需要,形成全国声学学科研究中心,经国务院副总理聂荣臻元帅批准,成立中国科学院声学研究所(以下简称声学所),将原中科院电子所的水声、超声、建筑声3个实验室,1958年成立的南海研究站、1960年成立的东海研究站、1961年成立的北海研究站整体纳入声学所。声学所是从事声学和信息处理技术研究的综...
    了解更多+
    现任领导
    李风华
    所长
    库卫群
    党委书记、副所长
    李明庚
    副所长(正局级)
    杨 军
    副所长
    杨 波
    副所长
    王 雷
    纪委书记
  • 机构设置
    领导机构
    所务会 党委会
    咨询机构
    学术委员会 学位评定委员会
    职能部门
    综合办公室 党委办公室 人力资源部 科技发展部 重大任务部 财务管理部 资产条件保障部 质量管理部 保密办公室 监督审计(纪委)办公室 造船办公室

    研究站
    南海研究站 东海研究站 北海研究站
    挂靠机构
    中国声学学会 全国声学标准化委员会 中国科学院声学计量站(CMA)
    研究单元
    声场声信息实验室
    水下环境信息感知实验室
    水下信息技术实验室
    海洋声学技术实验室
    水下航行器实验室
    超声学实验室
    噪声与音频声学实验室
    智能网络与信息处理技术实验室
    语音与智能信息处理实验室
    无人信息系统研究中心
  • 科研成果
    研究领域
    经过五十多年的发展,声学所形成了独具特色的六大研究领域:水声物理与水声探测技术、环境声学与噪声控制技术、超声学与声学微机电技术、通信声学和语言语音信息处理技术、声学与数字系统集成技术、高性能网络与网络新媒体技术。 【详情】
    成果概况
    获奖
    论文
    专利
    专著
    科研进展
    研究人员提出一种基于声阻抗效应的声表面波气体传感新方法
    2025-02-14
    声学所极地声学研究取得突破性进展
    2025-01-23
    研究人员在蜂窝结构中发现反常声传播特征并展示其在脱粘缺陷检测中的潜力
    2025-01-16
    声学所论文被评选为“2024年度中国高影响力数据论文”
    2024-12-11
    声学所王文团队论文获得Nature子刊2024年度热点论文奖
    2024-10-21
    中国科学院声学研究所语音与智能信息处理实验室团队在EUSIPCO 2024 LAP Challenge中夺冠
    2024-09-12
    研究人员提出面向网络加速的FPGA动态部分可重构方法
    2024-09-03
    研究人员提出逐符号运动补偿的256QAM水声通信方案
    2024-08-16
    研究人员提出基于深度学习的地层横波速度层析成像新方法
    2024-07-23
    研究人员利用零群速度特征提出一种复合蜂窝结构脱粘缺陷检测新方法
    2024-07-02
    研究人员提出适用于MIMO系统的目标检测与位置估计方法
    2024-06-03
  • 人才队伍
    院士专家
    汪德昭
    马大猷
    应崇福
    张仁和
    侯朝焕
    李启虎
    汪承灏
    人才招聘
    更多+
    中国科学院声学研究所2025年特别研究助理(博士后)招聘启事
    2025-04-03
    中国科学院声学研究所2025年招聘启事
    2025-04-03
    中国科学院声学研究所资产条件保障部岗位招聘启事
    2025-03-18
    中国科学院声学研究所诚邀优秀青年人才申报2025年度海外优青项目
    2025-03-03
    中国科学院声学研究所监督审计(纪委)办公室管理岗位招聘启事
    2025-03-03
    正高级专业技术岗位
    副高级专业技术岗位
    中科院青年创新促进会会员
    特别研究助理及博士后管理
  • 研究生教育
  • 党建与文化
    活动报道
    更多+
    共赏园林雅韵 乐享银龄时光——声学所组织开展退休职工2025年春游活动
    2025-05-16
    水下航行器党总支开展“严明岗位工作纪律”主题党日
    2025-05-16
    声场声信息党总支开展“严明岗位工作纪律”主题党日活动
    2025-05-09
    声学所党委举办深入贯彻中央八项规定精神学习教育读书班暨理论学习中心组集体学习会
    2025-05-07
    海洋声学技术党总支召开扩大会议
    2025-04-30
  • 交流合作
    学术交流
    更多+
    声学所举行2025年第5期学术交流会
    2025-04-15
    声学所举行2025年第4期学术交流会
    2025-04-15
    声学所举行2025年第3期学术交流会
    2025-04-02
    桐乡市科技局领导与清华大学国重实验室专家学者一行到访北海研究站
    2025-03-04
    白鱀豚新秀论坛暨水下航行器实验室学术交流会顺利举办
    2025-02-25
    科技合作
    更多+
    科技导报社调研声学所
    2025-03-10
    青岛市人大代表慈国庆参加市人大代表座谈会
    2024-03-27
    青岛高新区工委委员、管委副主任张建军调研北海研究站
    2023-12-04
    超快速高灵敏声表面波氢气传感器入选中国科协科研仪器优秀案例
    2023-03-28
    科技部社会发展科技司调研声学研究所相关工作
    2023-03-23
    国际会议
    更多+
  • 科学传播
    工作动态
    更多+
    我们的耳朵——中国科学院青促会北京分会 “爱科学小课堂”第 23期科普活动在声学所举行
    2024-09-10
    北京市中关村中学走进北海站开展科学实践活动
    2024-07-15
    《中国医学影像技术》5T专刊在京发布 国内首次系统性地在学术期刊上介绍和展示世界首创的超高场5T磁共振技术
    2024-06-28
    声学所作品获评2023年度全国优秀科普微视频
    2024-04-01
    声学所参加“嗨,科学!”中国科学院第六届科学节北京主场活动
    2023-10-31
    科技期刊
    科普文章
    更多+
    科普文章丨耳机里的声音为什么会有方向感?
    科普文章丨嘿,siri!嘈杂的酒吧里,AI为什么听不懂指令?
    科普文章丨神奇的主动降噪技术
    科普视频
    更多+
    科普视频丨杨波:揭秘“深海勇士号”载人潜水器
    科普视频丨声音的奥秘
    科普视频丨真空无法传声科普实验
    科普视频丨借声波一臂之力探神秘海底世界
  • 信息公开
    信息公开规定
    信息公开指南
    信息公开目录
    信息公开申请
    信息公开年度报告
    信息公开联系方式
  • 首页
  • 所况简介
    • 机构简介
    • 所长致辞
    • 现任领导
    • 历任主要领导
      • 历任所长
      • 历任党委书记
    • 院所风貌
  • 机构设置
    • 党的委员会
    • 学术委员会
    • 学位委员会
    • 组织机构
      • 领导机构
      • 咨询机构
      • 研究平台
        • 研究单元
        • 重点实验室(工程中心)
      • 职能部门
      • 研究站
      • 挂靠机构
  • 科研成果
    • 研究领域
    • 科研进展
    • 科研产出
      • 获奖
      • 论文
      • 专著
      • 专利
  • 人才队伍
    • 院士专家
    • 正高级专业技术岗位
    • 副高级专业技术岗位
    • 中科院青年创新促进会会员
      • 2011
      • 2012
      • 2013
      • 2014
      • 2015
      • 2016
      • 2017
      • 2018
      • 2019
      • 2020
      • 2021
    • 特别研究助理及博士后管理
      • 博士后公告
      • 博士后规章
    • 人才招聘
  • 交流合作
    • 学术交流
    • 国际会议
    • 科技合作
      • 合作动态
      • 专利转让信息
      • 合作项目
  • 研究生教育
  • 党建与文化
    • 党群园地
    • 组织文化
    • 形象标识
    • 活动报道
    • 文化副刊
      • 诗歌
      • 书画
      • 摄影
      • 散文
  • 科学传播
    • 时间轴
    • 工作动态
    • 科普作品
      • 科普文章
      • 科普视频
      • 其他
    • 科技期刊
  • 信息公开
    • 信息公开规定
    • 信息公开指南
    • 信息公开目录
    • 信息公开申请
    • 信息公开年度报告
    • 信息公开联系方式
  • 重要新闻
  • 党建动态
  • 综合新闻
  • 媒体报道
  • 学术报告
  • 通知公告
  • 最美科学家
  • 专题
  • 专题
    • 深入贯彻八项
    • 2025年全国两会
    • 学习贯彻党的二十届三中全会
    • 科技自立自强之路
    • 科学家精神教育基地
    • 2024年全国两会
    • 平语近人(第3季)
    • 中国科学院2024年度工作会议
    • 科技创新再出发
    • 学习贯彻习近平新时代中国特色社会主义思想主题教育
    • 学习两会精神
    • 学习宣传贯彻党的二十大精神
    • 中国科学院2022年度工作会
    • 2021年终科技盘点
    • 中国科学院“基础研究十条”
    • 十九届六中全会
    • 党史学习教育
    • 不忘初心牢记使命
    • 率先行动
    • 两学一做
    • 防灾减灾
    • 十八届四中全会
    • 喜迎十八大
    • 十九届五中全会
  • 快捷通道
    • OA系统
    • 继续教育网
    • ARP
    • 违法违纪举报
    • 信访渠道
    • 图书馆
    • 正版软件
    • 网站地图
  • 友情链接
    • 新闻媒体
    • 政府机构和组织
    • 国内院校
    • 国内科研机构
    • 国际科研机构
  • 网站纠错
媒体报道
您当前的位置:
首页 媒体报道

打破砂锅:网上搜索声音能否变成现实?

发布时间:2006-12-01 作者: 科技日报
【  小 中 大  】
   随着新兴的播客等多媒体传播形式的流行,在未来数年内,互联网将成为一个浩大的音视频档案库。如何在这样浩繁的数据库里查找所需的片断,未来的搜索技术能否像搜索文字一样迅速找到所需的声音?请关注——

  “你问我爱你有多深,我爱你啦———啦啦”……当记者对着麦克风哼着略带走调、吐字不清的经典老歌时,电脑显示屏立刻从数千首曲库中显示出了正确答案———《月亮代表我的心》,下面还有一串备选歌曲。

  只要“张张嘴”,对着麦克风说出歌名、歌词或者哼唱一段旋律,短短几秒钟,就可以从茫茫“歌海”搜索到想要的歌曲。近日,在国际音乐处理学术界举办的最高赛事(MIREX)中,中科院声学所中科信利实验室获得哼唱检索评测的第一名。

  耳听为虚,眼见为实。日前,记者来到该实验室,亲自体验了“动口不动手”的新一代语音搜索技术。

  哼出旋律轻松搜索歌曲

  随着互联网、计算及存储技术的日益普及,利用PC上的播放器、MP3随身听和具有音乐播放功能的手机,人们越来越容易地随时随地享受音乐。据不完全统计,世界上的音乐CD有380万种,包含4800万种音乐单曲,分布在80多种语言中,音乐资源确实可以用“浩如烟海”来形容。

  计算、通信和存储技术越来越便宜,存储空间越来越大,例如存储超过1000首歌的MP3已经成为普及型的产品。但是,如何使用户从音乐大海中方便的找到自己喜欢的音乐就变成了一个技术挑战。

  “基于文本的搜索引擎并不能有效解决这个难题。”中科信利语音实验室主任颜永红介绍说,中科院声学所借助于自身语音识别和音频处理的技术积累,从2002年就开始进行目标音频检索和基于内容的音乐检索核心技术研究。这项语音识别技术并没有停留在实验室,据介绍,目前该技术已经在河北等10余个省级电信运营商开通的彩铃服务中试运营。

  基于内容的音乐信息检索是指由用户输入一段音乐,然后根据用户的输入,在音乐数据库中搜索与之相似的曲目。用户只要直接说出歌曲、歌手名称即可迅速找到想要下载的彩铃。如果记不得,还可以哼唱6秒钟旋律,或说出歌曲中的一、两句歌词等方式,轻松地找到自己喜爱的音乐片段。这种技术不仅可以应用于电信网、互联网多媒体的搜索,还可以使人们在KTV等场合方便寻找歌曲。

  口语引擎帮您准确发音

  科研工作人员还为记者展示了广播电视新闻识别引擎。系统自动播出一段新闻联播,屏幕即刻出现了相应的文字,记者仔细检查,在几分钟的播音时间里,只出现了一个字的错误。

  颜永红介绍,这种类似“听写机”的系统,将音频通过听写机转化成对应的文字,处理检索文件将更加方便。它在电视台、广播电台等媒体应用广泛,还能代替会议活动的速录。

  据悉,这套中文电视广播新闻节目识别系统已经被英国Autonomy公司采用,并作为其提供给全国各电视台的数字媒体管理系统中一个核心技术模块。此外,它还可以测试语言发音、音调、节拍、音量等的标准程度,用于口语学习、音乐教育等领域。

  记者进入“口语语言学习引擎”,机器输出一句“千山鸟飞绝”,记者重复了一句,结果电脑很快评估出总体上的发音准确度,甚至给出了每个音素上的得分,并给出改进建议。

  颜永红打趣道:“现在,年轻人不都想当超级女生吗?利用此技术,可以纠正你唱歌中的旋律、节拍、吐字、音准等每个细节上的错误,有了这个老师,完全可以打造一个平民‘天后’。”

  多媒体内容检索前景可观

  哼一段旋律就能查到对应的歌曲,说一个关键词,电脑就能从网络中搜索到相关网页……这些看似“异想天开”的语音识别技术,近两年已经开始变成现实,逐步走向实际应用。

  在颜永红看来,由于多媒体内容制作成本下降,诸如《馒头》之类网民自制的音视频内容在互联网上日益增多,同时,随着新兴的播客、麦客等多媒体传播形式的流行,在将来数年内,互联网将成为一个浩大的音视频档案库。如何在这样浩繁的数据库里查找所需的片断,将成为困扰互联网搜索的难题。

  因此,基于多媒体内容搜索是下一代搜索引擎未来的发展方向,而语音识别技术必将是其中的关键。由于在多媒体中音频与视频是对应的,只要检索音频通道,就能搜索到相应的视频片段。

  虽然语音识别在精准度、口音、抗噪声等方面还有很多难题需要解决,并且其商业运营模式还不成熟,但颜永红依然认为,在“十一五”期间,会有越来越多的人接受自动语音识别技术。(转载自《科技日报》,记者 陈磊)

附件下载:

上一篇:

以地方发展需求为切入点推进院地合作——访声学所所长田静

下一篇:

张仁和院士和他的海洋声学研究

新闻媒体
  • 新闻媒体
  • 人民网
  • 新华网
  • 光明网
  • 央视网
  • 中国科技网
  • 科学网
政府机构和组织
  • 政府机构和组织
  • 中国政府网
  • 科技部
  • 财政部
  • 工业和信息化部
  • 国家自然科学基金委
  • 国家发展改革委
  • 中国科协
国内院校
  • 国内院校
  • 中国科学院大学
  • 中国科学技术大学
  • 哈尔滨工程大学
  • 南京大学
国内科研机构
  • 国内科研机构
  • 中船重工
  • 地科院
  • 医科院
  • 铁科院
国际科研机构
  • 国际科研机构
  • 美国声学学会
  • Scripps海洋研究所
  • 哥本哈根大学
  • 勒芒大学
旧版回顾 | 网站地图 | 联系我们
© 1996 - 2021 中国科学院声学研究所 版权所有备案序号:京ICP备16057196号-1
京公网安备110402500001号地址:北京市海淀区北四环西路21号中国科学院声学研究所
邮编:100190
官方微信