摘要
本申请涉及语音识别技术领域,提供一种语音识别模型的训练方法、装置及电子设备,用于提高语音识别的准确性。在知识蒸馏中,教师模型和学生模型能够从语音增强后的多个声谱图中充分学习语音的表示,从而提高语音识别的准确性,并且训练过程中,除了基于学生模型输出的第二概率分布计算硬损失值外,还用每个声谱图对应的教师模型输出的第一概率分布和学生模型输出的第二概率分布计算软损失值,从而用学习能力强的教师模型学习到的知识指导学生模型的训练,进一步提高了学生模型语音识别的准确性,同时,还引入了基于多个声谱图的第二概率分布计算的一致性正则化损失值,从而减少学生模型对标签的过度拟合,提高模型的泛化性。
技术关键词
声谱
后验概率
学生
语音识别模型
音频
教师
拼音
标签
词语
数据
声学特征
语音唤醒装置
通信接口
蒸馏
时域掩蔽
语音识别技术
电子设备
生成语音
模块
系统为您推荐了相关专利信息
音频分析仪
数据分析方法
指标
数据分析设备
数据分析装置