一种面向硬件的高精度梯度压缩方法

AITNT
正文
推荐专利
一种面向硬件的高精度梯度压缩方法
申请号:CN202411868116
申请日期:2024-12-18
公开号:CN119696591A
公开日期:2025-03-25
类型:发明专利
摘要
本申请涉及数据处理领域,公开了一种面向硬件的高精度梯度压缩方法,包括以下步骤:将梯度数据按块加载,每个数据块包含若干个浮点数;对每个浮点数进行符号位、指数位和尾数位的分离,并对尾数位截断,保留其高位部分;对指数位采用固定值预测或块平均值预测,计算残差,并对负残差进行反转处理;通过零映射编码剔除残差矩阵中的零列,生成紧凑的非零矩阵;最终将符号位、截断后的尾数位、零映射和非零矩阵打包形成压缩输出流。本发明通过分离、预测、残差计算和零编码等步骤,显著降低了梯度数据的存储和传输需求,同时保持模型训练的精度,该方法适合FPGA或GPU等硬件实现,具有低资源消耗、高压缩率和适应多种深度学习模型的优点。
技术关键词
梯度压缩方法 指数 残差矩阵 单精度浮点数 符号 深度学习模型 残差数据 压缩装置 数据分布 编码模块 输出模块 标志位 解码 格式
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号