一种面向分布式训练的残差显存优化方法和系统

AITNT
正文
推荐专利
一种面向分布式训练的残差显存优化方法和系统
申请号:CN202510826366
申请日期:2025-06-19
公开号:CN120671746A
公开日期:2025-09-19
类型:发明专利
摘要
本申请属于计算机存储技术领域,具体公开了一种面向分布式训练的残差显存优化方法和系统,该方法包括:获取压缩通信的分布式深度神经网络DNN模型训练中原始梯度与压缩梯度的差值作为残差;将DNN模型划分为可重用组和特定层,所述可重用组中包含结构相同的多个相邻残差层,所述特定层为不包含在可重用组中的层;基于所述可重用组中的平均残差,对所述可重用组中的残差进行缩减,并对所述特定层的残差进行维度压缩;基于缩减后的残差和维度压缩后的残差,更新DNN模型的参数。该方法可以降低分布式训练的显存开销。
技术关键词
分布式训练 DNN模型 分布式深度神经网络 计算机存储技术 计算机程序产品 处理器 可读存储介质 存储计算机程序 参数 存储器 模块 电子设备 内存
系统为您推荐了相关专利信息
1
数据脱敏方法、装置、设备及存储介质
数据加密 数据脱敏方法 字符 数据脱敏装置 数据获取单元
2
机器人的并联踝关节的位姿确定方法、装置、设备和产品
雅可比矩阵 编码器 表达式 电机 误差
3
一种可靠性驱动的重复数据删除存储优化方法
存储优化方法 边缘控制器 副本 服务器 LSTM模型
4
一种基于证书的后量子加密迁移系统、方法、设备及介质
发送方 接收方 非对称加密算法 量子加密算法 生成对称密钥
5
电动汽车充电负荷预测方法、装置和电子设备
充电负荷模型 充电负荷预测方法 CatBoost算法 数据 样本
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号