基于异构GPU集群的模型训练方法、装置及存储介质

正文

推荐专利

申请号：CN202510983253

申请日期：2025-07-17

公开号：CN120508395B

公开日期：2025-09-16

类型：发明专利

摘要

本公开关于一种基于异构GPU集群的模型训练方法、装置及存储介质，所述方法包括：获取异构GPU集群中每个GPU的硬件指标数据；获取待训练模型中深度学习算法对应的多个操作类型，并测量每个GPU执行每个操作类型对应操作的操作性能数据；获取每个GPU的通信带宽多维特征以及负载状态感知策略；根据每个GPU对应的所述硬件指标数据、所述操作性能数据、所述通信带宽多维特征以及所述负载状态感知策略，构建得到每个GPU的多维操作性能矩阵；根据每个GPU对应的多维操作性能矩阵，为所述待训练模型中每个结构层分配GPU进行模型训练得到目标模型，本公开提高了模型的训练效率，缩短了模型的训练时长。

技术关键词

并行流水线阶段策略通信带宽模型训练方法深度学习算法异构样本集群时延数据获取模块矩阵多层感知机模型训练装置注意力机制无线带宽技术模型训练模块电子设备处理器

系统为您推荐了相关专利信息

多模态流量分类方法、装置、设备及存储介质

流量分类方法融合策略融合特征时序依赖关系神经网络单元

一种多机器人同步控制方法及系统

集群管理中心编码动态故障工况

一种异常检测方法、装置、存储介质及电子设备

业务订单数据决策树模型决策树算法 CRM系统错误率

一种通用防火墙策略采集方法

通用数据模型异构防火墙策略规则集应急响应时间条目

一种基于数据挖掘的网络安全态势评估方法

极限学习机网络安全数据分类器模型网络安全态势评估量子态

基于异构GPU集群的模型训练方法、装置及存储介质

站点导航

APP 下载