基于DeepSpeed的梯度卸载优化方法、设备及存储介质

AITNT
正文
推荐专利
基于DeepSpeed的梯度卸载优化方法、设备及存储介质
申请号:CN202510276483
申请日期:2025-03-10
公开号:CN120144304A
公开日期:2025-06-13
类型:发明专利
摘要
本申请公开了一种基于DeepSpeed的梯度卸载优化方法、设备及存储介质,涉及模型训练技术领域,该方法包括:响应于执行梯度累加操作,获取当前FP16梯度数据;从扩展卡中读取上一次保存的FP16梯度数据;将上一次保存的FP16梯度数据与当前FP16梯度数据进行累加,得到累加后的梯度数据;将所述累加后的梯度数据重新写回所述扩展卡中。本申请通过在梯度累加过程中将梯度数据实时卸载至扩展卡中,显著降低了GPU内存占用,提升了大规模模型的训练效率。
技术关键词
优化器 优化设备 分区 模型训练技术 参数 内存 处理器 数据存储 可读存储介质 主机 存储器 计算机
系统为您推荐了相关专利信息
1
一种智能化装备管理方法及其装备管理系统
智能化装备 人工智能引擎 决策树模型 管理方法 数据管理模块
2
基于元学习和多专家模型的风机设备故障预测方法
神经网络故障预测 故障预测方法 风机设备 时间卷积网络 电力传动设备
3
适用于电力信息网络的网络攻击数据处理方法及装置
数据处理方法 标记 机器学习模型 数据处理装置 矩阵
4
一种基于Morris-CNN融合的冻煤列车均匀温升优化方法及设备
温升优化方法 训练卷积神经网络 参数 计算机程序指令 电磁加热
5
一种模型修正方法、装置、电子设备及存储介质
模型修正方法 风洞 量化评价指标 训练集优化 数值
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号