基于Zip-MoE模型分组混合专家层的中英文语音识别方法和系统

正文

推荐专利

申请号：CN202510607710

申请日期：2025-05-13

公开号：CN120126451B

公开日期：2025-07-18

类型：发明专利

摘要

本申请提出一种基于Zip‑MoE模型分组混合专家层的中英文语音识别方法和系统，Zip‑MoE模型包括6个编码器块，每两个编码器块间包含一个Bypass模块，学习前一个编码器块输出和当前编码器块输出加权的权重；前3个编码器块为标准的Zipformer结构；后3个编码器块采用含分组混合专家层的Zipformer‑MoE结构，用分组混合专家层替代Zipformer结构的最后一个前馈网络；分组混合专家层包括中文专家组、英文专家组和语种路由器，专家组均由若干个专家网络构成并分别配置无监督路由器。缓解了语种混淆的问题，能够适配不同时延流式场景，灵活扩展专家数量，无需进行预训练，大大提高了中英文的识别效率。

技术关键词

路由器无监督语音识别方法 Softmax函数掩码矩阵语种识别语音特征代表结构编码器语音识别系统索引计算机程序产品网络模块上采样字词时延

系统为您推荐了相关专利信息

航油管道的施工车辆调度方法、系统、装置

施工车辆管道网络机柜数据设备运行状态

基于TinyCRNN-GMM网络的无监督工业异常声音检测方法

异常声音高斯混合模型卷积循环神经网络工业故障检测智能工业设备

一种基于神经网络关键层的分布式模型训练方法

分布式模型参数可调汇聚节点神经网络架构搜索动态更新参数

一种基于改进POMO算法的组合优化算法

组合优化算法节点进化算法注意力机制梯度算法

一种基于决策一致性的深度神经网络模型指纹生成与验证方法

深度神经网络模型掩码矩阵验证方法样本指纹

基于Zip-MoE模型分组混合专家层的中英文语音识别方法和系统

站点导航

APP 下载