方言识别模型的训练方法及装置、方言识别方法

正文

推荐专利

申请号：CN202510561231

申请日期：2025-04-29

公开号：CN120472884A

公开日期：2025-08-12

类型：发明专利

摘要

本申请公开了一种方言识别模型的训练方法及装置、方言识别方法。其中，模型训练方法包括：利用有文本标注的第一方言样本集对包含特征提取模块、语音编码器和自然语言大模型的第一初始模型训练，得到第一方言识别模型；再利用第一方言识别模型预测的第一方言样本集的文本结果对含有第一方言识别模型中的特征提取模块和语音编码器、语音解码器的第二初始模型训练，得到第二方言识别模型；最后利用无文本标注的第二方言样本集和第一方言识别模型预测的第二方言样本集的文本结果对第二方言识别模型训练，得到目标方言识别模型。本申请解决了传统方言识别模型训练中需要大量样本，数据质量难以保证且标注成本较高的技术问题。

技术关键词

语音编码器语音解码器方言识别方法特征提取模块样本文本自然语言数据识别模型训练前馈神经网络归一化模块线性单元频谱特征编码模块模型训练方法计算机程序产品注意力

方言识别模型的训练方法及装置、方言识别方法

站点导航

APP 下载