MoE稀疏大模型的分阶段混合并行推理方法及系统

AITNT
正文
推荐专利
MoE稀疏大模型的分阶段混合并行推理方法及系统
申请号:CN202510542935
申请日期:2025-04-28
公开号:CN120069097B
公开日期:2025-07-22
类型:发明专利
摘要
本申请提供‌MoE稀疏大模型的分阶段混合并行推理方法及系统,涉及特定计算模型系统技术领域,方法包括:在预填充阶段控制MoE稀疏大模型逐层执行:在获取提示数据序列的各字符的专家号的同时,向各设备添加基于张量并行策略运行的第一混合专家层模型参数;再基于各设备中的基于专家并行策略运行的第二混合专家层模型参数进行专家并行计算;将字符恢复至设备初始位置并释放第二混合专家层模型参数;将模型最后层输出的预测字符发送至首个层以用于根据预测字符和各设备中的第一混合专家层模型参数执行解码阶段的推理。本申请能够解决现有‌MoE稀疏大模型推理技术采用的并行策略对预填充阶段以及解码阶段的适配性较差且通信开销较大的问题。
技术关键词
并行推理方法 字符 并行策略 分阶段 注意力 参数 序列 数据 调度装置 贪心算法 推理技术 处理器 推理系统 解码 计算机程序产品 存储器 内存
系统为您推荐了相关专利信息
1
一种基于实体导向的多文档摘要生成系统及方法
交叉注意力机制 摘要生成系统 层次注意力机制 实体 预训练语言模型
2
一种基于自动化采集的油价数据实时入库方法
入库方法 文档对象模型 页面内容 数据存储 文本
3
一种政务平台的数据访问预警方法及相关设备
风险评估模型 数据访问 访问特征 生成设备 政务
4
图像分割方法、装置、设备及介质
血管 智能模型 图像分割方法 光学相干断层扫描 局部特征提取
5
基于可穿戴设备的睡眠质量检测方法、设备及存储介质
睡眠特征 可穿戴设备 时序特征 睡眠阶段分类 序列
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号