摘要
本申请提供一种深度神经网络的剪枝优化方法和系统,方法包括以下步骤:对初始神经网络模型进行量化处理,生成量化后的神经网络模型;对所述量化后的神经网络模型进行预训练,实施第一次剪枝处理,从而压缩模型,生成预训练神经网络模型;将所述预训练神经网络模型转化为计算图,对所述计算图进行第二次剪枝处理,搜索规范解,生成剪枝后的计算图;对所述剪枝后的计算图进行微调优化,分配内存,生成剪枝优化后的神经网络模型,并在移动设备上执行。第一次剪枝,在保证精度的前提下压缩了模型,第二次剪枝仅搜索规范解,极大地减少了搜索空间,提高了推理效率,并且将硬件内存使用量降至最低,与现有技术相比,推理速度显著提高,且没有精度损失。
技术关键词
训练神经网络模型
深度神经网络
深度优先搜索
移动设备
精度
元素
字母
中间层
矩阵
资源分配
模块
冗余
可读存储介质
策略
数值
复杂度
程序
数据
通道
系统为您推荐了相关专利信息
特征提取模块
双头
YOLO模型
双检测头
滤波器
人脸识别方法
多任务级联卷积神经网络模型
三元组损失函数
图像数据存储方法
OA管理系统
多模态检测系统
状态监控模块
图形化界面编程
传输线
数据分析中心