摘要
本申请公开了一种方言识别模型的训练方法及装置、方言识别方法。其中,模型训练方法包括:利用有文本标注的第一方言样本集对包含特征提取模块、语音编码器和自然语言大模型的第一初始模型训练,得到第一方言识别模型;再利用第一方言识别模型预测的第一方言样本集的文本结果对含有第一方言识别模型中的特征提取模块和语音编码器、语音解码器的第二初始模型训练,得到第二方言识别模型;最后利用无文本标注的第二方言样本集和第一方言识别模型预测的第二方言样本集的文本结果对第二方言识别模型训练,得到目标方言识别模型。本申请解决了传统方言识别模型训练中需要大量样本,数据质量难以保证且标注成本较高的技术问题。
技术关键词
语音编码器
语音解码器
方言识别方法
特征提取模块
样本
文本
自然语言
数据
识别模型训练
前馈神经网络
归一化模块
线性单元
频谱特征
编码模块
模型训练方法
计算机程序产品
注意力