摘要
本申请公开了一种深度学习模型中敏感层搜索方法、装置及计算机设备。其中,该方法包括:采集目标模型在训练过程中采用的配置数据,其中,配置数据至少包括以下之一:目标模型中各层的权重值、激活值和梯度值;获取配置数据的数据分布特征,并提取目标模型中各网络层的结构特征;采用预先训练的评估模型对数据分布特征和结构特征进行分析,得到目标模型中各层的敏感度,并将各层中敏感度高于预设阈值的层确定为敏感层。本申请至少解决了相关技术中敏感层搜索结果准确率较低的技术问题。
技术关键词
数据分布特征
深度学习模型
搜索方法
计算机设备
编码器
策略
存储程序指令
计算机程序产品
存储器
处理器
注意力
模块
精度
参数