一种基于3D近内存处理的混合专家模型的混合并行和动态调度方法

AITNT
正文
推荐专利
一种基于3D近内存处理的混合专家模型的混合并行和动态调度方法
申请号:CN202510797791
申请日期:2025-06-16
公开号:CN120687215A
公开日期:2025-09-23
类型:发明专利
摘要
本发明提供一种基于3D近内存处理的混合专家模型的混合并行和动态调度方法,包括步骤:建立联合性能分析模型;离线线性规划优化专家分配;贝叶斯优化物理节点映射;在线推理;在线动态优先级检测;效率最优的专家预广播和通信友好的词元分发策略。本发明通过离线线性规划实现节点均衡优化,显著改善3D NMP计算负载不均衡问题;结合链路平衡的贝叶斯优化映射策略,增大通信加速比,减少片上网络NoC链路拥塞;动态调度策略通过计算负载预测和预广播机制,适应实时推理中专家激活的动态变化。本发明通过离线自动混合并行映射算法与在线动态调度策略的协同,有效平衡了计算负载与通信开销,显著提升了混合专家模型MoE在3D近内存处理架构上的推理效率。
技术关键词
动态调度方法 节点 最小化链路拥塞 并行策略 内存 分发策略 在线 离线 映射算法 通信效率 存储体 网络 线性 物理 频率 中间层 参数
系统为您推荐了相关专利信息
1
一种USB设备的虚拟化方法、车机、介质及产品
USB设备 宿主机系统 客户机系统 虚拟化方法 USB驱动
2
一种采用分布式储能有序充放电的台区电能质量治理方法
分布式光伏发电系统 分布式储能系统 策略优化模型 分布式光伏系统 电网运行约束
3
一种基于区块链跨链通信结构的跨域信息交互方法
区块链跨链通信 节点 信息交互方法 发送方 签名验签方法
4
定位方法、计算机程序产品、计算机设备及存储介质
图谱 节点 订单 列表 信号
5
一种城市轨道交通视频处理方法、装置、设备、介质及产品
服务组件 视频监控终端 轨道交通视频 节点 接收方
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号