摘要
本公开提供了一种语音识别模型训练方法和装置,涉及人工智能技术领域,具体涉及语音识别、深度学习、大模型等技术领域,可应用于人工智能的内容生成等场景。具体实现方案为:获取语音样本集,语音样本集包括至少一个语音样本,语音样本包括:音频特征序列和初始词单元序列;获取初始的语音识别模型,语音识别模型用于表征音频特征序列与预测词单元序列之间的对应关系;采用表征语种的预测词单元替换语音样本集中初始词单元序列中的语种词单元,得到训练样本集,预测词单元为将从语音样本集中选取的语音样本输入语音识别模型,得到的预测词单元序列中的预测词单元;基于训练样本集,训练语音识别模型,得到训练后的语音识别模型。
技术关键词
语音识别模型
序列
训练样本集
音频特征数据
关键词
噪声数据
语音识别方法
解码器
训练装置
编码器
语音识别装置
模块
处理器
采样率
系统为您推荐了相关专利信息
可调度潜力
能源管理方法
负荷预测模型
楼宇空调
生成电力
时间预测方法
空间权重矩阵
电力设施
生成特征集
XGBoost模型
知识问答系统
法律咨询服务
大语言模型
检索算法
查询关键词
节点
路径结构
网络安全威胁
图谱
融合深度学习模型