摘要
本发明公开了一种基于集成学习的多方言语音识别方法,涉及语音识别技术领域,用于解决现有模型无法实现差别度较大的不同种方言的识别,该方法包括以下步骤:获取样本数据,所述样本数据为多语言数据集,其包括语音录音、转录文本、说话者信息;将所述样本数据输入多方言语音识别模型进行识别,所述多方言语音模型为基于Transformer的端到端的语音识别模型,其包括专家混合体及通用专家,所述专家混合体用于处理特定口音数据,所述通用专家用于处理不同口音中的共性数据。本发明还公开了一种基于集成学习的多方言语音识别装置、电子设备和计算机存储介质。本发明通过专家混合体及通用专家结合,进而快速完成多方言识别。
技术关键词
方言语音识别方法
语音识别模型
集成学习模型
语音识别装置
数据
样本
编码器解码器
语音识别技术
计算机存储介质
注意力机制
文本
电子设备
处理器
识别模块
错误率
系统为您推荐了相关专利信息
丝杆升降机
三维仿真模型
数据监测方法
数据监测系统
升降故障
位点预测方法
多头注意力机制
夹角余弦
矩阵
特征提取模块
电网故障诊断模型
电路仿真模型
训练数据生成方法
训练数据生成系统
Simulink软件
液晶显示模组
驱动控制系统
刷新率
图像处理模块
伽马校正