摘要
本发明提供一种基于3D近内存处理的混合专家模型的混合并行和动态调度方法,包括步骤:建立联合性能分析模型;离线线性规划优化专家分配;贝叶斯优化物理节点映射;在线推理;在线动态优先级检测;效率最优的专家预广播和通信友好的词元分发策略。本发明通过离线线性规划实现节点均衡优化,显著改善3D NMP计算负载不均衡问题;结合链路平衡的贝叶斯优化映射策略,增大通信加速比,减少片上网络NoC链路拥塞;动态调度策略通过计算负载预测和预广播机制,适应实时推理中专家激活的动态变化。本发明通过离线自动混合并行映射算法与在线动态调度策略的协同,有效平衡了计算负载与通信开销,显著提升了混合专家模型MoE在3D近内存处理架构上的推理效率。
技术关键词
动态调度方法
节点
最小化链路拥塞
并行策略
内存
分发策略
在线
离线
映射算法
通信效率
存储体
网络
线性
物理
频率
中间层
参数
系统为您推荐了相关专利信息
USB设备
宿主机系统
客户机系统
虚拟化方法
USB驱动
分布式光伏发电系统
分布式储能系统
策略优化模型
分布式光伏系统
电网运行约束
区块链跨链通信
节点
信息交互方法
发送方
签名验签方法
服务组件
视频监控终端
轨道交通视频
节点
接收方