摘要
本发明提供一种基于解耦学习过程的深度学习模型后门攻击防御方法,属于人工智能和深度学习领域,包括:利用被篡改的数据集,以最小化第一损失函数的方式对深度学习模型进行监督学习训练;分别计算每个干净样本和中毒样本的预测熵,对预测熵进行过滤得到干净子集;利用干净子集,以最大化第二损失函数的方式对监督学习训练后的深度学习模型进行主动遗忘训练;删除数据集中除干净子集之外的样本的标签得到无标签数据集,将无标签数据集与干净子集合并形成半监督数据集,利用半监督数据集对主动遗忘训练后的深度学习模型进行半监督微调训练。本发明的鲁棒性强,成本低,防御效果显著。
技术关键词
深度学习模型
攻击防御方法
样本
无标签数据
后门
鲁棒性
过滤器
参数
策略
系统为您推荐了相关专利信息
异构特征
前馈神经网络
诊断方法
样本
混合聚类算法
分配控制方法
设备监测系统
增广拉格朗日
电能消耗量
燃料消耗量
新能源系统
状态预测方法
设备老化
建筑
计算机可读指令