摘要
本公开涉及深度学习大规模模型并行训练通信优化,具体涉及一种基于有损压缩的大规模并行通信优化方法,包括:将原始数据划分为N×N个块数据;各个进程非阻塞接收来自上一个进程的块数据,同时基于SZX算法压缩本进程上一轮接收到的块数据,再非阻塞发送所述压缩后的块数据至下一个进程,同时解压缩接收到的块数据并进行规约操作,直至每个进程持有规约子块结果;每个进程以环形的方式并行通信,直至每个进程都持有所有进程压缩后的规约子块结果;各个进程开始对接收到的所有压缩后的规约子块结果进行解压缩并存储数据。该方法降低了大模型张量并行训练中的通信开销,实现发送和接收与压缩和解压缩时间开销的相互掩蔽,节约了时间成本。
技术关键词
并行通信优化方法
有损数据压缩算法
进程
浮点数
位置指针
误差
偏差
环形
编码
系统为您推荐了相关专利信息
压缩数据收集方法
无线传感器网络
传感器节点
蚂蚁
压缩感知数据
迁移方法
机器人
控制策略
计算机程序指令
执行完整性校验
接收机
估计位置误差
竖直分量
导航卫星系统
计算机可读指令