摘要
本发明属于金融、医疗和人工智能技术领域,公开了一种语音识别模型的训练方法、装置、计算机设备及存储介质,所述方法包括:获取特定任务语音训练数据,根据语音识别的特定场景定义特定任务输入指令,并调整预训练语音识别模型的先验文本序列的输入格式;将调整输入格式后的先验文本序列和音频编码向量输入至预训练语音识别模型的解码器中进行解码,并根据解码结果预测预训练语音识别模型输出的字符序列;根据预测的字符序列定义单调性限制损失函数,并基于定义的单调性限制损失函数构建目标损失函数;基于目标损失函数对训练时的语音识别模型进行更新,得到训练好的语音识别模型。本发明提升了语音识别模型在特定场景中进行语音识别的准确率。
技术关键词
多任务
音频编码
编码向量
序列
数据
音频特征提取
文本
字符
解码器
构建语音识别模型
位置编码器
注意力
格式
计算机设备
频谱特征
系统为您推荐了相关专利信息
电子病历生成系统
机器人知识库
模块化机器人
疾病特征
模版