语音识别模型的训练方法、装置及电子设备

正文

推荐专利

语音识别模型的训练方法、装置及电子设备

申请号：CN202510117569

申请日期：2025-01-24

公开号：CN120048251A

公开日期：2025-05-27

类型：发明专利

摘要

本申请涉及语音识别技术领域，提供一种语音识别模型的训练方法、装置及电子设备，用于提高语音识别的准确性。在知识蒸馏中，教师模型和学生模型能够从语音增强后的多个声谱图中充分学习语音的表示，从而提高语音识别的准确性，并且训练过程中，除了基于学生模型输出的第二概率分布计算硬损失值外，还用每个声谱图对应的教师模型输出的第一概率分布和学生模型输出的第二概率分布计算软损失值，从而用学习能力强的教师模型学习到的知识指导学生模型的训练，进一步提高了学生模型语音识别的准确性，同时，还引入了基于多个声谱图的第二概率分布计算的一致性正则化损失值，从而减少学生模型对标签的过度拟合，提高模型的泛化性。

技术关键词

声谱后验概率学生语音识别模型音频教师拼音标签词语数据声学特征语音唤醒装置通信接口蒸馏时域掩蔽语音识别技术电子设备生成语音模块

系统为您推荐了相关专利信息

基于终端模型的数据检索和管理方法

机器学习模型检索对象管理方法终端数据

音频设备的房间声学校正方法、装置、设备及存储介质

频率响应麦克风校准音频设备房间混响时间

一种基于改进向量场一致性的误匹配剔除方法

剔除方法局部特征描述符关键点 EM算法图像

一种基于体渲染知识蒸馏的在线矢量地图构建方法及装置

矢量地图语义特征二维图像数据学生教师

一种音频分析仪数据分析方法、装置、设备及存储介质

音频分析仪数据分析方法指标数据分析设备数据分析装置

语音识别模型的训练方法、装置及电子设备

站点导航

APP 下载