在人工系统中,科研人员通常借助由多个传声器组成的传声器阵列来解决声源定位和分离问题。具有高精度声源定位和分离能力的传声器阵列往往需要较大的阵元数量和物理尺寸,这种阵列系统不仅不便于安装和操控,处理多通道信号的计算成本往往也很大,从而导致其应用受限。
受生物听音机制的启发,中科院噪声与振动重点实验室的博士生孙雪聪与其导师杨军研究员、贾晗研究员提出了一种基于声学超材料的单通道多声源的定位与分离系统,用一个带有超材料外壳的单通道麦克风实现了三维空间中多个同时发声声源的实时定位与分离。
相关研究成果近期发表于国际学术期刊 Advanced Science (DOI: 10.1002/advs.201902271),并被选为当期封面文章(Inside back cover)。
研究人员将麦克风嵌入到精心设计的三维超材料结构中(图1a),该结构以与来波方向相关的方式修改麦克风的频率响应(图1b),从而对来自三维空间中不同方向的信号进行编码。研究人员还提出了一种联合重建算法VSPCA-OMP,该算法具有较低的复杂度,可以基于采集到的单通道数据实现多声源的实时定位和分离。整个系统的工作流程示意图如图1c所示。
图1 基于声学超材料的单通道多声源的定位与分离系统:(a)超材料外壳模型(b)超材料外壳某4个方向的频率响应仿真结果(c)定位与分离系统的工作流程图(图/中科院声学所)
为了证明该系统的定位与分离能力,研究人员针对多个场景开展了听音测试,结果表明,当空间中同时发声的声源数量不超过3个时,该系统的定位与分离的平均准确率维持在90%以上(图2)。由于所提出的算法复杂度较低,每次重建过程耗时均控制在1s以内,良好的实时性使该系统也可用于识别和追踪声目标。
图2 多场景听音测试结果(图/中科院声学所)
未来该系统有望应用于智能场景监测、机器听觉及语音识别的前端处理等领域。
本研究得到国家自然科学基金(No.11874387),中国科学院青年创新促进会(No.2017029),中国科学院声学研究所青年英才计划项目(QNYC201719)的资助。
关键词:声源定位与分离,声学超材料,压缩感知
参考文献:
SUN Xuecong, JIA Han, ZHANG Zhe, YANG Yuzhen, SUN Zhaoyong, YANG Jun.Sound Localization and Separation in 3D Space Using a Single Microphone with a Metamaterial Enclosure. Advanced Science n/a, 1902271.
论文链接:
https://doi.org/10.1002/advs.201902271