摘要
本申请提供一种基于神经网络架构搜索的混合精度量化方法和系统,方法包括:将整个模型结构划分为若干个模块;对整个模型以及各个模块进行量化敏感度测试,设置每个模块的初始化比特数;基于划分的模块数量,设定权重、激活的量化结构,构建搜索空间;基于所述初始化比特数,在保持模型整体平均量化精度不变的约束下,以整体验证性能为优化目标,在所述搜索空间内进行搜索,进行权重与激活的位宽自适应分配,获得混合精度的最佳量化方案。本申请通过引入基于神经网络架构搜索(NAS)的自适应权重与激活位宽分配机制,在有限比特预算下最大化模型表达能力与任务性能。
技术关键词
神经网络架构搜索
比特数
神经网络模型
精度
图像分类模型
性能指标定义
图像恢复方法
图像分类方法
量化系统
对齐模块
处理器
集成模块
搜索模块
遗传算法
可读存储介质
存储器
策略
误差
系统为您推荐了相关专利信息
高精度视觉
时空融合特征
调控单元
管控系统
网络拓扑
电化学储能电站
优化运行方法
液冷系统
电池仓
调控空调
时间序列预测模型
检查方法
数据
自然资源
多设备