摘要
本申请涉及深度强化学习模型压缩与硬件加速技术领域,涉及一种基于深度强化学习的神经网络结构化剪枝方法及装置、介质。所述方法包括:获取待剪枝神经网络模型,为神经网络每一层构建多维状态向量;构建层级自适应的混合剪枝模型;将多维状态向量输入层级自适应的混合剪枝模型,通过双分支Actor网络输出连续剪枝比例与离散剪枝策略的联合动作;所述Critic网络通过硬件感知型复合奖励函数量化动作的长期收益;迭代训练层级自适应的混合剪枝模型,按照每层剪枝比例和剪枝策略执行剪枝动作,选取最优策略;根据最优策略对神经网络剪枝部署于FPGA。本发明为神经网络模型在FPGA等端侧设备的精准高效部署提供创新解决方案。
技术关键词
剪枝策略
剪枝模型
分层特征提取
特征提取模块
Sigmoid函数
神经网络剪枝
连续动作空间
神经网络模型
分支
深度确定性策略梯度
深度强化学习模型
层级
硬件加速技术
输出特征
浮点数
非线性