摘要
本发明公开了一种基于强化学习的结构化剪枝处理方法。该方法通过线性回归突触操作预测机制和目标感知奖励函数协同优化剪枝策略。其中,线性回归突触操作预测机制基于微调前后的突触操作线性关系建立预测模型,精准估计剪枝后的资源消耗;目标感知奖励函数将突触操作和参数数量约束转化为奖励函数中的惩罚项,结合强化学习技术动态平衡模型准确率与资源限制。实验表明,本发明能够显著降低突触操作和参数规模,同时保持高准确率,并支持多约束条件下的高效搜索,大幅提升了脉冲神经网络在计算和存储资源受限的边缘设备上的部署能力。
技术关键词
剪枝策略
线性回归模型
强化学习算法
深度确定性策略梯度
脉冲
强化学习技术
多约束条件
建立预测模型
机制
生成随机
参数
网络
资源
数据
受限
指数
规模
定义