摘要
本申请公开了一种语音识别模型训练方法、装置、设备及存储介质,涉及语音识别技术领域,包括:利用预设音频处理方式处理初始音频信号,并基于声学特征一致性约束条件、识别准确性约束条件和教师‑学生对比约束条件处理得到的目标特征序列,得到初始语音训练数据;利用语音合成中心处理初始语音训练数据,并利用预设声学场景模拟系统处理得到的待处理语音训练数据,得到待增强语音训练数据;利用注意力增强机制基于词级别处理待增强语音训练数据,得到词增强语音训练数据,利用对比学习框架并基于句子级别处理词增强语音训练数据,利用得到的目标语音训练数据训练初始语音识别模型,得到目标语音识别模型。这样能够提高训练语音识别模型的效率。
技术关键词
语音识别模型
声学特征
声学场景
多粒度特征
动态时间规整算法
教师
学生
序列
特征提取器
瞬态噪声
音频
模拟系统
注意力
混响时间
关键词
房间脉冲响应
训练数据处理
系统为您推荐了相关专利信息
模型训练方法
矢量量化
声学特征
音频生成方法
数据
智能康复训练
多模态信息融合
肌电特征
姿态特征
动态时间规整算法
智能生态水资源管理系统
非均质含水层
多源异构数据
生成对抗网络架构
数字孪生体
处理单元
异构计算架构
游戏
协同管理模块
处理器