一种面向硬件的高精度梯度压缩方法

正文

推荐专利

一种面向硬件的高精度梯度压缩方法

申请号：CN202411868116

申请日期：2024-12-18

公开号：CN119696591A

公开日期：2025-03-25

类型：发明专利

摘要

本申请涉及数据处理领域，公开了一种面向硬件的高精度梯度压缩方法，包括以下步骤：将梯度数据按块加载，每个数据块包含若干个浮点数；对每个浮点数进行符号位、指数位和尾数位的分离，并对尾数位截断，保留其高位部分；对指数位采用固定值预测或块平均值预测，计算残差，并对负残差进行反转处理；通过零映射编码剔除残差矩阵中的零列，生成紧凑的非零矩阵；最终将符号位、截断后的尾数位、零映射和非零矩阵打包形成压缩输出流。本发明通过分离、预测、残差计算和零编码等步骤，显著降低了梯度数据的存储和传输需求，同时保持模型训练的精度，该方法适合FPGA或GPU等硬件实现，具有低资源消耗、高压缩率和适应多种深度学习模型的优点。

技术关键词

梯度压缩方法指数残差矩阵单精度浮点数符号深度学习模型残差数据压缩装置数据分布编码模块输出模块标志位解码格式

一种面向硬件的高精度梯度压缩方法

站点导航

APP 下载