基于Zip-MoE模型分组混合专家层的中英文语音识别方法和系统

AITNT
正文
推荐专利
基于Zip-MoE模型分组混合专家层的中英文语音识别方法和系统
申请号:CN202510607710
申请日期:2025-05-13
公开号:CN120126451B
公开日期:2025-07-18
类型:发明专利
摘要
本申请提出一种基于Zip‑MoE模型分组混合专家层的中英文语音识别方法和系统,Zip‑MoE模型包括6个编码器块,每两个编码器块间包含一个Bypass模块,学习前一个编码器块输出和当前编码器块输出加权的权重;前3个编码器块为标准的Zipformer结构;后3个编码器块采用含分组混合专家层的Zipformer‑MoE结构,用分组混合专家层替代Zipformer结构的最后一个前馈网络;分组混合专家层包括中文专家组、英文专家组和语种路由器,专家组均由若干个专家网络构成并分别配置无监督路由器。缓解了语种混淆的问题,能够适配不同时延流式场景,灵活扩展专家数量,无需进行预训练,大大提高了中英文的识别效率。
技术关键词
路由器 无监督 语音识别方法 Softmax函数 掩码矩阵 语种识别 语音特征 代表 结构编码器 语音识别系统 索引 计算机程序产品 网络 模块 上采样 字词 时延
系统为您推荐了相关专利信息
1
航油管道的施工车辆调度方法、系统、装置
施工车辆 管道 网络机柜 数据 设备运行状态
2
基于TinyCRNN-GMM网络的无监督工业异常声音检测方法
异常声音 高斯混合模型 卷积循环神经网络 工业故障检测 智能工业设备
3
一种基于神经网络关键层的分布式模型训练方法
分布式模型 参数可调 汇聚节点 神经网络架构搜索 动态更新参数
4
一种基于改进POMO算法的组合优化算法
组合优化算法 节点 进化算法 注意力机制 梯度算法
5
一种基于决策一致性的深度神经网络模型指纹生成与验证方法
深度神经网络模型 掩码矩阵 验证方法 样本 指纹
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号