MoE稀疏大模型的分阶段混合并行推理方法及系统

正文

推荐专利

申请号：CN202510542935

申请日期：2025-04-28

公开号：CN120069097B

公开日期：2025-07-22

类型：发明专利

摘要

本申请提供‌MoE稀疏大模型的分阶段混合并行推理方法及系统，涉及特定计算模型系统技术领域，方法包括：在预填充阶段控制MoE稀疏大模型逐层执行：在获取提示数据序列的各字符的专家号的同时，向各设备添加基于张量并行策略运行的第一混合专家层模型参数；再基于各设备中的基于专家并行策略运行的第二混合专家层模型参数进行专家并行计算；将字符恢复至设备初始位置并释放第二混合专家层模型参数；将模型最后层输出的预测字符发送至首个层以用于根据预测字符和各设备中的第一混合专家层模型参数执行解码阶段的推理。本申请能够解决现有‌MoE稀疏大模型推理技术采用的并行策略对预填充阶段以及解码阶段的适配性较差且通信开销较大的问题。

技术关键词

并行推理方法字符并行策略分阶段注意力参数序列数据调度装置贪心算法推理技术处理器推理系统解码计算机程序产品存储器内存

系统为您推荐了相关专利信息

一种基于实体导向的多文档摘要生成系统及方法

交叉注意力机制摘要生成系统层次注意力机制实体预训练语言模型

一种基于自动化采集的油价数据实时入库方法

入库方法文档对象模型页面内容数据存储文本

一种政务平台的数据访问预警方法及相关设备

风险评估模型数据访问访问特征生成设备政务

图像分割方法、装置、设备及介质

血管智能模型图像分割方法光学相干断层扫描局部特征提取

基于可穿戴设备的睡眠质量检测方法、设备及存储介质

睡眠特征可穿戴设备时序特征睡眠阶段分类序列

MoE稀疏大模型的分阶段混合并行推理方法及系统

站点导航

APP 下载