北京市科学技术奖候选项目公示

发布时间：2019-09-09 作者：科技发展部

　　我单位申报的“智能语音能力平台关键技术及其在智能客服行业应用”项目拟申请提名2019年度北京市科学技术奖，特进行公示。公示期： 2019 年 9 月 9 日至 2019 年 9 月 15 日，公示期内如对公示内容有异议，请您向中国科学院声学研究所科技发展部（公示单位科管部门名称）反映。

　　联系人及联系电话：金老师 010-82547935

　　公示内容：

　　项目名称：智能语音能力平台关键技术及其在智能客服行业应用

　　候选单位（含排序）：1、中国科学院声学研究所 2、北京中科信利技术有限公司

　　候选人（含排序）：01颜永红 02张鹏远 03徐及 04程高峰 05王文超 06黎塔 07周军 08赵庆卫 09刘建 10王丽 11徐晓艳 12洪密 13郝锐朋 14梁宏 15赖胜娟

　　项目简介：

　　随着我国经济的飞速发展，各个行业的企业客户服务业务也迅猛发展。但传统客服中心的种种缺陷严重影响业务的顺利开展，例如按键式交互系统菜单繁琐复杂、层级过深，严重影响用户体验；客户呼叫需求量巨大，现有人工坐席供不应求；传统人工质检的录音抽检率常小于1%，覆盖率很低。针对上述需求，本项目自主研发了智能语音能力平台和智能语音客服系统。该系统极大地提高了用户的交互体验，全面覆盖了企业100%的质检工作；同时可以显著减少企业客服人力，降低企业运营成本，助力企业快速发展。

　　主要技术创新点：

　　1.创新性地提出了基于映射门控循环神经网络单元与扩展窗输入的循环神经网络建模算法。对现有的主流循环神经网络单元进行了简化，设计了计算复杂度更低、收敛速度更快的循环神经网络基本单元，提出了能够更好利用深度神经网络上下文信息的声学模型，并完成了高精度、低功耗的线上通用智能语音识别系统的构建。

　　2.提出了一种高性能、高效率的可解释神经网络语言模型，克服了传统神经网络语言模型正则化复杂、梯度消失、计算效率低等问题；提出了一种基于最大后验估计的可解释神经网络语言模型自适应方法，解决了低资源条件下训练数据中的语言现象难以覆盖测试数据中常见语言现象的问题。

　　3.提出了理想浮值掩蔽方法和基于等化消除模型的两阶段语音增强处理模型，解决了复杂声学环境和信道对目标语音产生畸变的问题。提出了一种基于约束序贯隐马尔可夫模型的噪声建模方法。所研发的前端处理系统显著提升了复杂环境和信道条件下的语音质量。

　　4.提出了基于多时间尺度的深度说话人特征提取技术，从多维角度对说话人的发音特征进行学习，并通过联合分类和距离度量学习的方法实现说话人特征的类间方差最大化和类内方差最小化，构建了泛化能力强、特征区分性明显的说话人识别系统。

　　该项目取得的创新成果包括发表论文161篇（含SCI检索36篇）；获得授权发明专利34项，申请发明专利39项；获得软件著作权15项；获批国家标准1项。该项目研发的智能语音能力平台和智能语音客服系统，总体达到国际先进水平，提升了我国客服领域的智能化水平。我司先后为中移在线和中国电信提供语音识别和语音合成引擎，支持中移在线23个省级分公司上线智能客服语音分析系统，支持中国电信20个省级分公司上线智能客服语音导航系统。我单位与其他合作伙伴合作，已在广发银行、宁波银行、苏宁电商、平安、河北高速等60余家客户上线智能语音客服系统，产生直接经济效益超过九千万元。

　　中国科学院声学研究所

　　科技发展部

　　2019年9月9日

附件下载：

关于紧盯中秋国庆期间“四风”问题、深入贯彻落实中央八项规定精神的通知

中国科学院声学研究所智慧园区建设项目采购公告