摘要
本发明公开了一种多方言语音识别方法,涉及语言处理技术领域,用于解决现有多方言识别困难的问题,该方法包括以下步骤:获取方言数据;提取所述方言数据的特征,并将所述特征表征为语音表征;将所述语音表征输入基于稀疏性偏置计算模式的Transformer编码器提取方言表征;根据所述方言表征信息进行方言分类,得到方言分类结果;将所述分类结果与所述语音表针输入多专家集成系统进行预测,得到语音识别结果。本发明还公开了一种多方言语音识别装置、电子设备和计算机存储介质。本发明通过基于稀疏性偏置计算模式编码器结合多专家集成系统,实现多方言的准确高效识别。
技术关键词
方言语音识别方法
集成系统
注意力机制
编码器
语音识别装置
前馈神经网络
表针
矩阵
数据
语音识别模块
键值
计算机存储介质
特征提取器
模式
特征提取模块
序列
文本
电子设备
处理器
系统为您推荐了相关专利信息
网络建模方法
构建知识图谱
节点
统计算法
实时数据
图像编码器
图像分析模型
样本
图像分析方法
大语言模型
局部优化模型
解算方法
深度学习模型
编码器参数
多源融合
分类识别方法
局部纹理特征
贝叶斯算法
融合特征
钟表