摘要
本发明涉及机器学习领域,具体为基于关系型知识蒸馏的深度学习模型后门攻击防御方法,对训练数据集样本进行分组,得到若干组数据样本;将每组数据样本输入至教师模型进行处理,得到每组数据样本的关系型知识,以及剔除后门样本,得到若干组干净数据样本;基于所有组干净数据样本和关系型知识,对学生模型进行关系型知识蒸馏训练,确定第一类损失;基于教师模型与学生模型之间的数据特征图关系,确定第二类损失;基于第一类损失和第二类损失,对学生模型更新模型参数。本发明能够避免深度学习模型在训练过程中直接学习后门触发器特征和后门数据集危害深度学习模型工作,能够更加有效地保证后门攻击防御后的模型的精确度。
技术关键词
样本
后门
深度学习模型
攻击防御方法
模型更新
学生
教师
蒸馏
生成关系
数据标签
参数
框架