摘要
本发明属于边缘计算领域,涉及到一种边缘设备中基于剪枝压缩的模型部署方法,其通过解析目标边缘设备的硬件架构配置构建联合约束条件集,结合待部署模型的层间依赖关系,确定待部署模型各网络层压缩比例上限,以此对待部署模型执行混合剪枝操作,并在关键网络层预留冗余权重区块,通过编译部署剪枝后模型,实时感知模型部署后于运行期间环境运行干扰特征,判断是否触发在线微调机制以更新所述冗余权重区块参数,并基于微调性能反馈数据迭代优化剪枝边界参数,既规避现有技术因静态剪枝策略引发的模型崩溃风险,又通过预留冗余权重区块实现模型在资源受限边缘设备上的持续自适应与性能优化,有效提升边缘设备模型部署灵活性。
技术关键词
模型部署方法
结构单元
干扰特征
冗余
参数
微调机制
生成有向无环图
执行浮点运算
动态随机存取存储器
并行计算架构
统计特征
内存管理单元
节点
功耗
数据
地址映射表
硬件加速器
剪枝策略
精度
读取设备