摘要
本申请实施例提供了一种模型量化方法和装置、电子设备及存储介质,属于人工智能技术领域。该方法包括:将神经网络模型转化为Flatbuffer文件;提取出Flatbuffer文件中的权重信息,得到Light‑Flatbuffer文件;根据权重信息组成权重数组;在Light‑Flatbuffer文件中添加索引信息,索引信息用于表征每一层神经网络层的权重数据在权重数组中的偏移位置;确定Light‑Flatbuffer文件中的激活值信息;保留第一激活值的原始位数,并将第二激活值量化到预设位数,得到量化后的神经网络模型。基于此,本申请实施例能够减少更多的神经网络模型内存占用,同时损失更少的神经网络模型精度。
技术关键词
神经网络模型
索引
电子设备
可读存储介质
数据
人工智能技术
模块
存储器
处理器
存储设备
计算机
频率
内存
框架
精度
系统为您推荐了相关专利信息
编码
人工智能算法
数据处理方法
超参数
双曲正切函数
气体检测方法
多任务卷积神经网络
传感器敏感材料
传感器阵列
电子鼻系统
风险预测模型
风险预测方法
度量
数据分布特征
层级
数据分析方法
离散特征
联合损失函数
机器学习算法
多层感知器