2025年4月2日,中国科学院声学研究所2025年第5期学术交流会在DSP大楼4层多功能厅成功举办。本次交流会由科技发展部和语音与智能信息处理实验室共同组织,邀请了香港中文大学(深圳)武执政副教授作学术报告,声学所广大职工和学生参加了会议,语音与智能信息处理实验室副主任黎塔研究员主持会议。
武执政作题为《通用语音基座模型研究进展》的学术报告,报告围绕“让AI像人一样自然交流”展开分享。针对如何让AI系统具备“共情能力”,既能“听得清、听得懂”,还能捕捉“人情味”等问题进行了探讨。此外,武教授还详细讲述了多任务语音基座模型的最新突破,探讨了AI如何实现“有眼力见儿”的情感化交互问题。
与会人员围绕大模型在语音增强等单一任务中的适用性、多任务联合训练相比单任务模型的性能优势,以及大模型预训练方法等关键议题展开了深入研讨。