基于低比特浮点数与模型训练后量化的模型压缩方法

AITNT
正文
推荐专利
基于低比特浮点数与模型训练后量化的模型压缩方法
申请号:CN202411939757
申请日期:2024-12-26
公开号:CN119862917A
公开日期:2025-04-22
类型:发明专利
摘要
本发明公开了一种基于低比特浮点数与模型训练后量化的模型压缩方法,该模型压缩是适用于卷积网络和线性网络的。支持用户将高精度的模型压缩为4位或8位的低比特浮点数表示的模型。该方法通过用户设定的比特位宽进行模型压缩,在模型量化模块层内,使用了一种配置搜索算法找到最优的低比特浮点数量化配置,支持相同位宽的混合量化方案,其中相同位宽的浮点数存在多种指数位和尾数位的组合;在模型量化模块层之间的有数据校准的场景下,使用了一种联合校准优化流程,通过将原模型的输出作为当前量化后模型的数据校准对象,最大限度地减少量化后模型与原模型之间的输出误差,从而维持模型压缩后的精度。本发明提出使用低比特浮点数进行PTQ的模型压缩方法,为PTQ提供了一种新方案,可广泛应用于各种模型压缩的训练后量化任务中,维持模型压缩后的精度。
技术关键词
浮点数 配置搜索空间 模型压缩方法 网络模块 通道 元素 量化误差 格式 场景 矩阵 标识 数据校准 符号 二维卷积网络
系统为您推荐了相关专利信息
1
一种脑部MRI超分辨率交叉融合自适应特征增强Transformer方法
峰值信噪比 生成高分辨率 浅层特征提取 图像重建 模块
2
一种数据矩阵处理方法、装置、电子设备以及存储介质
矩阵 安全带 像素点 神经网络模型 线段
3
一种RAG端到端检索优化方法
排序模型 训练集 整体优化方法 检索文本块 提升系统
4
一种基于无人机的船舶水尺图像识别方法及系统
船舶水尺图像 图像识别方法 无人机 图像识别模型训练 卷积神经网络模型
5
出货柜
出货机构 货柜 定位标记 接驳台 驱动组件
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号