基于自适应梯度稀疏化的加速AI分布式训练方法、系统、设备及介质

AITNT
正文
推荐专利
基于自适应梯度稀疏化的加速AI分布式训练方法、系统、设备及介质
申请号:CN202510022097
申请日期:2025-01-07
公开号:CN120124703A
公开日期:2025-06-10
类型:发明专利
摘要
本发明公开了基于自适应梯度稀疏化的加速AI分布式训练方法、系统、设备及介质,方法包括:S1、PS初始化模型参数并发送给所有worker;S2、收到初始化模型参数,worker对DNN完成多次本地训练;S3、分层梯度聚类,采用效率感知梯度稀疏化方法决定是否对该层梯度聚类;采用分层自适应梯度感知方法为需要聚类的层确定聚类数;worker将压缩后的梯度发送给PS;S4、PS对收到的梯度进行解码并梯度聚合,聚合后的梯度用于更新PS上的本地模型参数;S5、PS将更新后的模型参数发送给worker,worker收到最新模型参数后替换原有模型参数并继续新的训练周期;S6、重复S2至S5,直到DNN训练完成。本发明实现加速分布式训练的同时避免模型精度的损失,可用于各种大模型的分布式训练。
技术关键词
分布式训练方法 二分查找算法 Kmeans算法 稀疏化方法 聚类 参数 分布式训练系统 训练深度神经网络 数据分布 处理器 分层 DNN模型 服务器 计算机设备 对象 可读存储介质 解码 存储器
系统为您推荐了相关专利信息
1
一种海绵道路的渗透性能测试方法及系统
海绵道路 渗透性能测试方法 压力变化曲线 渗透性能测试系统 特征值
2
基于聚类和深度学习模型的电力设备在线故障诊断方法
在线故障诊断方法 深度学习模型 样本 电网电力设备 预训练模型
3
一种环境评价前期准备管理系统
数据采集子系统 环境数据采集系统 Huffman编码 管理系统 分析系统
4
一种风力发电异常数据分析方法及系统
风力发电数据 异常数据分析方法 风力发电站 指标 参数
5
基于区块链的数字安全管理方法及系统
管理中心服务器 语义 数据 队列 序列
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号