摘要
本公开关于一种数据处理方法、装置、电子设备及存储介质,该方法包括:获取用于分布式模型训练的训练样本顺序,训练样本顺序包括与多个迭代一一对应的多个训练样本集;基于训练样本顺序中各迭代所对应训练样本的算力消耗,确定执行分布式模型训练的集群性能损失;预测基于训练样本顺序执行分布式模型训练所得模型的模型效果损失;基于集群性能损失和模型效果损失确定综合损失,以最小化综合损失为目标,采用在不同迭代的训练样本集之间进行样本重组的方式,更新训练样本顺序直至满足预设结束条件得到目标训练样本顺序。本公开在确保模型训练效果的同时提高了硬件利用率和整体训练效率,尤其适用于混合并行的分布式模型训练。
技术关键词
分布式模型
数据处理方法
训练样本集
批量
集群
参数
周期
电子设备
数据获取单元
处理器
可读存储介质
数据处理装置
标签
计算机程序产品
比率
轨迹
偏差
指令
基础
系统为您推荐了相关专利信息
业务系统
分区
业务数据查询
数据存储策略
数据处理方法
数字化牙颌模型
正畸矫治器
压低前牙
分阶段
牙模型
水下机器人
能源控制方法
数据
能源控制系统
离散余弦变换