当环境中存在噪声或混响干扰时,传统的降噪算法或解混响算法能够有效抑制相应的干扰,但当这两种干扰同时存在时,这些算法的性能明显下降,从而导致语音通信的质量与自动语音识别系统的准确率大大降低。
为了同时抑制环境中存在的噪声与混响,中科院语言声学与内容理解重点实验室的硕士生宋思远与其导师李军锋研究员等人提出了一种融合了多通道加权预测误差与多通道维纳滤波的一体化降噪与解混响算法。
相关研究成果2020年8月在线发表于学术期刊 Applied Acoustics 。
研究人员用加入单通道维纳后滤波的最小方差无失真响应(Minimum Variance Distortionless Response, MVDR)波束形成器实现了多通道维纳滤波器,其输入为加权预测误差(Weighted Predict Error, WPE)预处理器的输出信号。他们采用相对早期传递函数,而非整个相对传递函数或直达声信号,来实现MVDR波束形成器,并使用WPE的预测对干扰信号的协方差矩阵进行近似计算;随后根据整个系统的输出信号,来更新WPE中的目标信号方差。
模拟和真实条件下的实验结果表明,在噪声与混响同时存在的环境下,该方法可以对语音进行有效地增强处理。当麦克风与声源距离为3米时,算法处理后的语音识别词错率降低了38.50%。研究人员将该方法与五种最近被提出的相关算法进行对比,结果表明,新算法在语音质量、语音清晰度和语音识别性能等方面均优于其他算法。
当环境中存在噪声与混响时,本项研究成果很大程度上提升了语音通信系统与自动语音识别系统的用户体验。
此研究获得国家重点研发计划(No.2017YFB1002803)和国家自然科学基金(No.11722437,11674352)资助。
本研究所提算法的系统结构(图/中科院声学所)
关键词:
语音增强;降噪;解混响
参考文献:
SONG Siyuan, CHENG Longbiao, LUAN Shuming, YAO Dingding, LI Junfeng, YAN Yonghong. An integrated multi-channel approach for joint noise reduction and dereverberation. Applied Acoustics, 171: 107526. DOI: 10.1016/j.apacoust.2020.107526.
论文链接:
https://doi.org/10.1016/j.apacoust.2020.107526