摘要
本发明公开了一种神经网络量化方法、装置、设备及可读存储介质,应用于神经网络技术领域,包括:基于目标神经网络不同层的精度要求,确定目标神经网络不同层的量化敏感度;基于量化敏感度确定的每层量化精度范围确定目标神经网络的配置,得到多种量化配置,每种量化配置中基于可重构计算单元确定的量化计算组合不同;将多种量化配置作为输入,设定的目标神经网络的性能和神经网络加速器的性能作为目标,在多种量化配置中进行寻优,得到最优量化精度配置。本发明可以基于每层量化精度范围确定与每层对应的量化方法,从而在满足设定性能目标的情况下,使得每层可以以不同的量化方法进行量化,从而可以实现神经网络性能和计算效率的平衡。
技术关键词
神经网络加速器
神经网络量化方法
重构
动态量化方法
精度
神经网络技术
可读存储介质
存储计算机程序
非线性
数据中心
模块
关系
处理器
存储器
场景
参数
系统为您推荐了相关专利信息
重构方法
坐标
图像块
边缘检测算法
非暂态计算机可读存储介质
钒液流电堆
组装系统
伸缩机构
支撑组件
平衡电网负荷
轮毂电机
车辆协同控制方法
耦合动力学模型
模块
扩展卡尔曼滤波