摘要
本申请公开了一种基于DeepSpeed的梯度卸载优化方法、设备及存储介质,涉及模型训练技术领域,该方法包括:响应于执行梯度累加操作,获取当前FP16梯度数据;从扩展卡中读取上一次保存的FP16梯度数据;将上一次保存的FP16梯度数据与当前FP16梯度数据进行累加,得到累加后的梯度数据;将所述累加后的梯度数据重新写回所述扩展卡中。本申请通过在梯度累加过程中将梯度数据实时卸载至扩展卡中,显著降低了GPU内存占用,提升了大规模模型的训练效率。
技术关键词
优化器
优化设备
分区
模型训练技术
参数
内存
处理器
数据存储
可读存储介质
主机
存储器
计算机
系统为您推荐了相关专利信息
智能化装备
人工智能引擎
决策树模型
管理方法
数据管理模块
神经网络故障预测
故障预测方法
风机设备
时间卷积网络
电力传动设备
数据处理方法
标记
机器学习模型
数据处理装置
矩阵
温升优化方法
训练卷积神经网络
参数
计算机程序指令
电磁加热
模型修正方法
风洞
量化评价指标
训练集优化
数值