一种基于混合专家并行机制的通信调度方法

正文

推荐专利

一种基于混合专家并行机制的通信调度方法

申请号：CN202510474371

申请日期：2025-04-16

公开号：CN120407168A

公开日期：2025-08-01

类型：发明专利

摘要

本发明属于大规模深度学习模型训练技术领域，具体为一种基于混合专家并行机制的通信调度方法。本发明的通信调度方法，包括构建负载均衡模块、通信资源分配模块和并行化调度模块三部份，根据专家模型的受欢迎程度与计算负载情况，对专家模型的参数切片与映射策略进行动态调整实现负载均衡；改变通信库的原语执行模式，使All‑Reduce操作支持异步执行，并通过多线程机制并行处理All‑to‑All和All‑Reduce通信任务。在模型训练过程中实现负载均衡和节点间All‑to‑All通信与节点内All‑Reduce通信的并行化。本发明在保持数据一致性的同时，充分利用链路带宽，减少通信等待时间。实验结果表明，在混合专家模型训练中有效提升GPU利用率，减少训练时间。

技术关键词

通信调度方法通信资源分配负载均衡模块通信链路资源深度学习模型训练机制通信等待时间通信带宽跨节点数据执行器多线程策略同步性切片

系统为您推荐了相关专利信息

一种基于机器视觉的数控车床加工辅助系统

辅助系统数控车床智能路径规划三维模型视觉检测模块

基于图注意力网络和多智能体强化学习的工业制造工作流调度方法

工作流调度方法强化学习模型容器特征多层感知机网络

基于深度学习的PET-CT鼻咽癌图像增强方法

图像增强方法深度学习数据集解剖学结构图像分割切片

基于YOLO与LSTM的用户桌面行为审计方法及系统

审计模型桌面审计方法实时视频审计系统

一种基于人工智能的隐伏矿体三维定位预测方法

隐伏矿体定位预测方法三维地质模型协同工作平台并行处理架构

一种基于混合专家并行机制的通信调度方法

站点导航

APP 下载