2021年10月15日至18日,由中国中文信息学会、中国计算机学会主办,江苏师范大学和北京工业大学承办的第十六届全国人机语音通讯会议(National Conference on Man-Machine Speech Communication, NCMMSC)在江苏徐州市顺利召开。声学所的中科院语言声学与内容理解重点实验室博士研究生孙国伦在张鹏远研究员指导下撰写的论文 Temporal Convolution Network Based Joint Optimization of Acoustic-to-Articulatory Inversion 获得了2021年度最佳论文奖。
在该获奖论文中,作者针对发音器官运动轨迹反演问题,提出一种基于时域卷积网络的时序序列预测模型,并从均方误差(Root Mean Square Error)和相关系数(Correlation Coefficient)两个方面联合优化预测模型,通过实验验证这种方法在缩减了模型参数量的同时提升了运动反演的性能。
全国人机语音通讯会议从1990年开创以来已成功召开16届,是国内语音领域最权威的会议,也是国内语音领域广大专家、学者和科研工作者交流最新研究成果、促进该领域研究和开发工作不断进步的重要平台。本次会议共接受录用论文130余篇,经过优秀提名和专家评选等环节,综合论文质量与现场展示情况,评选出4篇最佳论文,旨在表彰学者的在相关研究领域内的学术科研成果。