摘要
本申请公开了一种噪声语音识别模型的训练及语音识别方法、装置及设备。该噪声语音识别模型通过语音表征解耦模块,能够在多变的噪声环境中实现对声学编码器输出的语音表征深度噪声抑制,提取更清晰的干净去噪特征表示输入至Transducer解码器,从而增强整体模型的噪声鲁棒性以及识别性能。基于预测语音识别结果与标准语音识别结果的第一损失,和预测去噪特征表示与标准特征表示的第二损失,确定的目标损失函数,对模型中非固定参数模块进行针对性训练,实现语音表征解耦模块和Transducer解码器的协同优化,最终使得训练完成的噪声语音识别模型在复杂噪声环境下,既能有效去除噪声干扰,又能准确完成语音到文本的转换,提升模型在噪声环境的鲁棒性和识别准确率。
技术关键词
噪声语音
识别语音数据
语音识别方法
噪声特征
样本
解码器
噪声标签
识别模型训练
噪声鲁棒性
语音识别装置
编码器参数
模块
计算机设备
噪声分类
噪声信息
噪声抑制
系统为您推荐了相关专利信息
工单管理方法
历史工单数据
工单管理系统
机器学习算法
工单管理技术
认证系统
管理方法
信道状态信息
电力系统
接入点
实例分割模型
输出特征
样本
交互式机器人
水下图像数据