基于集成学习的多方言语音识别方法、装置、设备及介质

正文

推荐专利

申请号：CN202411519847

申请日期：2024-10-29

公开号：CN119400156A

公开日期：2025-02-07

类型：发明专利

摘要

本发明公开了一种基于集成学习的多方言语音识别方法，涉及语音识别技术领域，用于解决现有模型无法实现差别度较大的不同种方言的识别，该方法包括以下步骤：获取样本数据，所述样本数据为多语言数据集，其包括语音录音、转录文本、说话者信息；将所述样本数据输入多方言语音识别模型进行识别，所述多方言语音模型为基于Transformer的端到端的语音识别模型，其包括专家混合体及通用专家，所述专家混合体用于处理特定口音数据，所述通用专家用于处理不同口音中的共性数据。本发明还公开了一种基于集成学习的多方言语音识别装置、电子设备和计算机存储介质。本发明通过专家混合体及通用专家结合，进而快速完成多方言识别。

技术关键词

方言语音识别方法语音识别模型集成学习模型语音识别装置数据样本编码器解码器语音识别技术计算机存储介质注意力机制文本电子设备处理器识别模块错误率

系统为您推荐了相关专利信息

一种输电线路与外部危险源之间的距离确定方法、设备、介质及产品

线路双目立体匹配算法数据中心雷达图像

一种丝杆升降机运行数据监测方法及系统

丝杆升降机三维仿真模型数据监测方法数据监测系统升降故障

一种蛋白质相互作用位点预测方法及系统

位点预测方法多头注意力机制夹角余弦矩阵特征提取模块

一种电网故障诊断模型的训练数据生成方法及系统

电网故障诊断模型电路仿真模型训练数据生成方法训练数据生成系统 Simulink软件

一种支持高刷新率的液晶显示模组驱动控制系统和方法

液晶显示模组驱动控制系统刷新率图像处理模块伽马校正

基于集成学习的多方言语音识别方法、装置、设备及介质

站点导航

APP 下载