语音识别模型的训练方法、装置及电子设备

AITNT
正文
推荐专利
语音识别模型的训练方法、装置及电子设备
申请号:CN202510117569
申请日期:2025-01-24
公开号:CN120048251A
公开日期:2025-05-27
类型:发明专利
摘要
本申请涉及语音识别技术领域,提供一种语音识别模型的训练方法、装置及电子设备,用于提高语音识别的准确性。在知识蒸馏中,教师模型和学生模型能够从语音增强后的多个声谱图中充分学习语音的表示,从而提高语音识别的准确性,并且训练过程中,除了基于学生模型输出的第二概率分布计算硬损失值外,还用每个声谱图对应的教师模型输出的第一概率分布和学生模型输出的第二概率分布计算软损失值,从而用学习能力强的教师模型学习到的知识指导学生模型的训练,进一步提高了学生模型语音识别的准确性,同时,还引入了基于多个声谱图的第二概率分布计算的一致性正则化损失值,从而减少学生模型对标签的过度拟合,提高模型的泛化性。
技术关键词
声谱 后验概率 学生 语音识别模型 音频 教师 拼音 标签 词语 数据 声学特征 语音唤醒装置 通信接口 蒸馏 时域掩蔽 语音识别技术 电子设备 生成语音 模块
系统为您推荐了相关专利信息
1
基于终端模型的数据检索和管理方法
机器学习模型 检索对象 管理方法 终端 数据
2
音频设备的房间声学校正方法、装置、设备及存储介质
频率响应 麦克风校准 音频设备 房间 混响时间
3
一种基于改进向量场一致性的误匹配剔除方法
剔除方法 局部特征描述符 关键点 EM算法 图像
4
一种基于体渲染知识蒸馏的在线矢量地图构建方法及装置
矢量地图 语义特征 二维图像数据 学生 教师
5
一种音频分析仪数据分析方法、装置、设备及存储介质
音频分析仪 数据分析方法 指标 数据分析设备 数据分析装置
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号