摘要
本申请涉及数据处理领域,公开了一种面向硬件的高精度梯度压缩方法,包括以下步骤:将梯度数据按块加载,每个数据块包含若干个浮点数;对每个浮点数进行符号位、指数位和尾数位的分离,并对尾数位截断,保留其高位部分;对指数位采用固定值预测或块平均值预测,计算残差,并对负残差进行反转处理;通过零映射编码剔除残差矩阵中的零列,生成紧凑的非零矩阵;最终将符号位、截断后的尾数位、零映射和非零矩阵打包形成压缩输出流。本发明通过分离、预测、残差计算和零编码等步骤,显著降低了梯度数据的存储和传输需求,同时保持模型训练的精度,该方法适合FPGA或GPU等硬件实现,具有低资源消耗、高压缩率和适应多种深度学习模型的优点。
技术关键词
梯度压缩方法
指数
残差矩阵
单精度浮点数
符号
深度学习模型
残差数据
压缩装置
数据分布
编码模块
输出模块
标志位
解码
格式