摘要
本发明公开一种用于卷积神经网络的多维度复合缩放方法,主要解决现有技术缩放网络时参数冗余和搜索缓慢的问题。其实现方案是:选取基线网络,设定其FLOPs上限;选取缩放关系约束,确定网络分辨率、宽度、深度缩放因子;调整基线网络生成多个候选网络;构建候选网络的延迟评估模型;使用此模型和网络精度筛选候选网络,得到基线网络的最佳缩放配置网络分辨率缩放因子er、网络宽度缩放因子ew、网络深度缩放因子ed;按照该最佳缩放配置对基线网络进行缩放。本发明减少了缩放网络的参数冗余,实现了更高的参数效率,提高了候选网络的生成速度,加快了评估候选网络架构的过程,提高了整体的搜索效率,可用于将神经网络模型部署到资源有限的硬件设备中。
技术关键词
分辨率
因子
基线
缩放方法
关系
内存
网络深度
评估网络性能
网络架构
精度
深度学习框架
卷积滤波器
样本
训练集数据
代表
配置网络
神经网络模型
参数