中国科学院声学研究所与中移在线服务有限公司等合作研发的 “一体化端到端智能语音技术及其在服务行业应用”项目成果获得2023中国电子学会科技进步奖二等奖。
该成果由语音与智能信息处理实验室程高峰副研究员牵头完成。该项目针对智能服务应用中多地方口音识别准确率低、智能化应用延时长、语音合成拟人化程度低等难点进行技术突破,研发了一体化端到端智能语音技术,支撑包括中国移动在内的多行业多企业的客服数智化转型。
该技术提出了融合时长建模的流式端到端语音识别基础架构以及基于截断自注意力机制的流式Transformer模型、利用非平行语音文本数据对的自监督预训练算法和双分支伪标签半监督训练算法以及一种具有高表现力的基于解耦迁移的多风格多语言语音合成方法。
本项目实现了运营商领域规模最大的智能语音技术应用,覆盖用户超过9亿,AI能力的月均服务超30亿次,支撑超过20省10086智能语音客服与客服智能质检、超20省的10086动态播报等。
相关奖励公告已在中国电子学会官网发布(https://www.cie.org.cn/list43/12219.html)。