摘要
本发明提出一种基于比特分配算子的神经网络量化压缩方法,该方法将比特分配算子应用于YOLO网络模型,对所述YOLO网络模型中的骨干模块和颈部模块分别进行不同程度的量化操作,降低存储空间,便于在资源受限的设备上运行。所述比特分配算子通过动态识别网络权重的变化,并根据不同网络层的权重浮动变化量及时调整权重参数量化的比特位宽,从而减少YOLO模型的存储空间和训练的计算量,使得量化后的模型精度接近于原始模型精度,解决了YOLO网络训练过程中由于权重浮动而导致的量化后精度严重下降的问题,从而保证YOLO模型可以有效适应资源受限的硬件设备,减小参数量化带来的精度损失。
技术关键词
YOLO模型
网络
硬件设备
代表
精度
算法
动态
超参数
受限
格式
模块
有效性
资源
符号
数据
因子
机制
关系
系统为您推荐了相关专利信息
边缘路由器
虚拟桌面
交通工具
因特网协议IP地址
图像
工程机械
兼容方法
车载终端
多协议
联邦学习模型
实体关系抽取方法
实体关系数据
注意力
前馈神经网络
文本特征向量
多源异构数据处理
规划系统
源节点
图论方法
邻居