摘要
本申请适用于智能语音处理技术领域,提供了一种语种分类模型训练方法、语种识别方法、装置及智能设备。所述语种分类模型训练方法包括:获取第一声学特征,所述第一声学特征是指音频片段的声学特征;将所述音频片段的声学特征依次输入初始语种分类模型的N层编码器,得到N层所述编码器各自输出的第一编码特征,N为大于1的整数;将各所述第一编码特征输入所述初始语种分类模型的融合模块,得到第一融合特征;基于所述第一融合特征和所述初始语种分类模型的语种识别模块,训练所述初始语种分类模型,得到目标语种分类模型,所述目标语种分类模型用于识别音频数据的语种类别。通过本申请可提高语种识别的准确率与鲁棒性。
技术关键词
分类模型训练方法
声学特征
融合特征
语种识别方法
编码特征
音频
编码器
注意力
智能设备
字符
参数
模型训练模块
智能语音
数据获取模块
计算机程序产品
编码模块
系统为您推荐了相关专利信息
故障自检方法
存储芯片
存储单元
频域特征
存储组件
多尺度特征提取
饱和度
图像增强方法
融合特征
图像增强模型
参数校准方法
特征融合网络
磷酸铁锂电池
融合特征
电流
行人轨迹预测方法
养老机器人
融合时空特征
时空融合特征
雾天环境