异构硬件集群分布式训练方法、装置、电子设备及介质

AITNT
正文
推荐专利
异构硬件集群分布式训练方法、装置、电子设备及介质
申请号:CN202510229319
申请日期:2025-02-27
公开号:CN120066731B
公开日期:2025-11-07
类型:发明专利
摘要
本申请提供了异构硬件集群分布式训练方法、装置、电子设备及介质,属于计算机技术领域。该方法包括:基于待训练模型和异构硬件,确定异构并行训练策略;基于异构并行训练策略以及异构硬件,构建用于执行待训练模型的模型训练任务的进程网格;不同进程网格与异构硬件中的不同硬件类型具有映射关系;进程网格被调用后在具有映射关系的硬件类型对应的异构硬件上执行;基于异构并行训练策略以及映射关系,构建进程网格之间的异构通信组;调用进程网格执行所述待训练模型的模型训练任务。本申请的技术方案可以实现任意多款硬件集群混合,实现异构集群的高效扩展,可以基于待训练模型和异构硬件确定优选的异构并行训练策略,提供更加灵活的并行策略。
技术关键词
异构 分布式训练方法 进程 网格 数据并行策略 集群 子模块 芯片 关系 流水线 标识 电子设备 可读存储介质 逻辑 物理
系统为您推荐了相关专利信息
1
一种基于数据增强的破片侵彻靶板弹道极限速度预测方法
GBDT模型 样本 交叉验证法 交叉验证方法 KNN算法
2
一种基于深度学习和聚类联合方法的玉米叶片病害部位的分割方法
分割方法 玉米 图像 叶片 边缘分割技术
3
语义信息传输方法、装置、设备及存储介质
正交频分复用 信息传输方法 生成发送信号 语义特征 网格
4
游戏对象交互方法、装置、电子设备和存储介质
图形用户界面 对象交互方法 控件 动画 指令
5
一种用于干衣机的加热动态控制方法及系统
干衣机 动态控制方法 动态控制系统 加热控制组件 异构传感器
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号