论文
一种时域到心理声学频域变换的研究
第一作者: | 仇波 |
---|---|
英文第一作者: | Qiu Bo |
联系作者: | 杨军 |
英文联系作者: | Qiu Bo |
发表年度: | 2008 |
卷: | 27 |
摘要: | 双耳听觉技术是近年来国内外音频技术发展的一个热点I卜引。2003年,Faller提出一种FFT框架下的基于双耳信息的多卢道音频压缩算法(BCo,在 将多卢道的信号压缩成单声道信号的同时,提取声道之间影响人的宅问听觉感知的参数作为边信息,经常规的编解码器进行编解码,极大的降低了传输数据量,并且保存了相应的窄间信息【3】。BCC算法应用于3D音频信号和双耳音频信号(如双耳录音信号或经HR]陌处理后的信号)时,在非均匀的频域子带(低频窄,高频宽)上估计边信息。由于经常规编码器编码后的信号能量主要存在于中低频段,BCC算法存在低频子带参数估计精度不足影响解码后空间感知质量的问题。本文利用非均匀的离散傅立叶变换时域信号变换到心理声学频域,实现听觉子带的均匀划分,提高了中低频子带的参数估计精度,尝试改进BCC算法的空间感知效果。本文第二部分介绍了相关的心理声学基础;第三部分引入了ND兀':具体的变换方式将在第四部分提出;第五部分给出了该变换方式应用于BCC后得到的主观测试结果;第六部分给出结论。 |
刊物名称: | 声学技术 |