语音识别模型的训练方法、装置、计算机设备及存储介质

正文

推荐专利

申请号：CN202411698120

申请日期：2024-11-25

公开号：CN119541467B

公开日期：2025-09-30

类型：发明专利

摘要

本发明属于金融、医疗和人工智能技术领域，公开了一种语音识别模型的训练方法、装置、计算机设备及存储介质，所述方法包括：获取特定任务语音训练数据，根据语音识别的特定场景定义特定任务输入指令，并调整预训练语音识别模型的先验文本序列的输入格式；将调整输入格式后的先验文本序列和音频编码向量输入至预训练语音识别模型的解码器中进行解码，并根据解码结果预测预训练语音识别模型输出的字符序列；根据预测的字符序列定义单调性限制损失函数，并基于定义的单调性限制损失函数构建目标损失函数；基于目标损失函数对训练时的语音识别模型进行更新，得到训练好的语音识别模型。本发明提升了语音识别模型在特定场景中进行语音识别的准确率。

技术关键词

多任务音频编码编码向量序列数据音频特征提取文本字符解码器构建语音识别模型位置编码器注意力格式计算机设备频谱特征

系统为您推荐了相关专利信息

一种检索结果智能排序方法

关键词智能排序方法文本分词信息处理技术

基于预设规则和模块化机器人的电子病历生成系统及方法

电子病历生成系统机器人知识库模块化机器人疾病特征模版

一种基于数据驱动支持策略的航空布撒器翼型高维气动优化方法及其系统

气动优化方法布撒器航空教学优化算法翼型

一种含水层储气库建库驱替前缘识别方法

网格驱替前缘识别方法界面层速度模型

时间与内存高效的大语言模型边缘协同微调方法及系统

微调方法测试微调流水线内存设备组

语音识别模型的训练方法、装置、计算机设备及存储介质

站点导航

APP 下载