一种基于比特分配算子的神经网络量化压缩方法

AITNT
正文
推荐专利
一种基于比特分配算子的神经网络量化压缩方法
申请号:CN202410898581
申请日期:2024-07-05
公开号:CN118862964A
公开日期:2024-10-29
类型:发明专利
摘要
本发明提出一种基于比特分配算子的神经网络量化压缩方法,该方法将比特分配算子应用于YOLO网络模型,对所述YOLO网络模型中的骨干模块和颈部模块分别进行不同程度的量化操作,降低存储空间,便于在资源受限的设备上运行。所述比特分配算子通过动态识别网络权重的变化,并根据不同网络层的权重浮动变化量及时调整权重参数量化的比特位宽,从而减少YOLO模型的存储空间和训练的计算量,使得量化后的模型精度接近于原始模型精度,解决了YOLO网络训练过程中由于权重浮动而导致的量化后精度严重下降的问题,从而保证YOLO模型可以有效适应资源受限的硬件设备,减小参数量化带来的精度损失。
技术关键词
YOLO模型 网络 硬件设备 代表 精度 算法 动态 超参数 受限 格式 模块 有效性 资源 符号 数据 因子 机制 关系
系统为您推荐了相关专利信息
1
使用虚拟桌面远程执行数据分析
边缘路由器 虚拟桌面 交通工具 因特网协议IP地址 图像
2
一种工程机械云边端架构多协议兼容方法及系统
工程机械 兼容方法 车载终端 多协议 联邦学习模型
3
一种应用于音频数据的多模态实体关系抽取方法
实体关系抽取方法 实体关系数据 注意力 前馈神经网络 文本特征向量
4
多模态模型的抗幻觉训练方法、装置、设备及存储介质
跨模态 多模态 图谱 数据 动态门控
5
一种基于多源异构数据处理的核事故应急行动规划系统
多源异构数据处理 规划系统 源节点 图论方法 邻居
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号