摘要
本申请提供了一种模型训练方法、语音识别方法、语音识别装置、电子设备、计算机可读存储介质和计算机程序产品,涉及语音处理技术领域,该训练方法包括获取目标序列,目标序列为具有噪声的样本语音数据的音频特征序列;将目标序列输入语音识别模型的自注意力层,控制自注意力层对目标序列中的局部子特征和该局部子特征的上下文特征进行注意力处理,得到注意力处理后的每个子特征;基于注意力处理后的每个子特征得到样本语音数据的文本识别结果;基于文本识别结果与样本语音数据携带的标注文本之间的差异训练语音识别模型。本申请能够提高语音识别模型识别声音信号中关键词音节的准确率和响应速度,提升人机交互的体验。
技术关键词
模型训练方法
语音识别模型
语音识别方法
注意力
噪声数据
文本识别
语音识别装置
样本
序列
音频特征提取
可执行程序代码
计算机程序产品
矩阵
信噪比
信号
可读存储介质
电子设备