基于集成学习的多方言语音识别方法、装置、设备及介质

AITNT
正文
推荐专利
基于集成学习的多方言语音识别方法、装置、设备及介质
申请号:CN202411519847
申请日期:2024-10-29
公开号:CN119400156A
公开日期:2025-02-07
类型:发明专利
摘要
本发明公开了一种基于集成学习的多方言语音识别方法,涉及语音识别技术领域,用于解决现有模型无法实现差别度较大的不同种方言的识别,该方法包括以下步骤:获取样本数据,所述样本数据为多语言数据集,其包括语音录音、转录文本、说话者信息;将所述样本数据输入多方言语音识别模型进行识别,所述多方言语音模型为基于Transformer的端到端的语音识别模型,其包括专家混合体及通用专家,所述专家混合体用于处理特定口音数据,所述通用专家用于处理不同口音中的共性数据。本发明还公开了一种基于集成学习的多方言语音识别装置、电子设备和计算机存储介质。本发明通过专家混合体及通用专家结合,进而快速完成多方言识别。
技术关键词
方言语音识别方法 语音识别模型 集成学习模型 语音识别装置 数据 样本 编码器解码器 语音识别技术 计算机存储介质 注意力机制 文本 电子设备 处理器 识别模块 错误率
系统为您推荐了相关专利信息
1
一种输电线路与外部危险源之间的距离确定方法、设备、介质及产品
线路 双目立体匹配算法 数据中心 雷达 图像
2
一种丝杆升降机运行数据监测方法及系统
丝杆升降机 三维仿真模型 数据监测方法 数据监测系统 升降故障
3
一种蛋白质相互作用位点预测方法及系统
位点预测方法 多头注意力机制 夹角余弦 矩阵 特征提取模块
4
一种电网故障诊断模型的训练数据生成方法及系统
电网故障诊断模型 电路仿真模型 训练数据生成方法 训练数据生成系统 Simulink软件
5
一种支持高刷新率的液晶显示模组驱动控制系统和方法
液晶显示模组 驱动控制系统 刷新率 图像处理模块 伽马校正
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号