一种基于对抗剪枝和知识蒸馏的后门防御方法

正文

推荐专利

申请号：CN202510018839

申请日期：2025-01-07

公开号：CN119940471A

公开日期：2025-05-06

类型：发明专利

摘要

本发明公开了一种基于对抗剪枝和知识蒸馏的后门防御方法，包括：S1、在神经网络进行模型训练前，为所有神经元引入掩码并初始化掩码值，并给模型加入对抗扰动；S2、将防御数据集输入模型进行训练，通过掩码值是否高于设定的门槛值来判断该神经元是否被剪枝；S3、选取剪枝过好得到的最好的网络用于后续的蒸馏操作，若未能得到较好性能的模型则返回步骤S2，将剪枝后的网络作为教师网络，未进行任何处理的模型作为学生网络；S4、将学生模型中间层注意力与教师网络的中间注意力层进行加权对齐；S5、通过观察模型的精度和攻击成功率的降低来评估模型的防御效果是否达标，否则返回步骤S4，继续训练。本发明通过结合对抗剪枝和知识蒸馏，实现了擦除后门模型的后门神经元，大大减少了攻击者的恶意行为，同时保持了模型的性能不受影响。该方法对深度学习领域的防御研究具有重要的理论价值和实践意义。

技术关键词

后门教师学生知识蒸馏技术门槛网络鲁棒性梯度下降优化算法标记知识蒸馏方法精度数据策略分类准确率有效性注意力机制特征选择

系统为您推荐了相关专利信息

融合自监督学习的半监督尾矿库目标检测方法和装置

尾矿库高分辨率遥感影像标记大规模遥感影像马赛克

一种用户信息处理方法及装置

学生信息处理方法成绩聚类算法检索加密数据

鸟类语义识别模型的训练方法、鸟类语义识别方法及装置

多模态特征语义识别方法文本图谱学生

膝关节周围截骨术展示模型

展示模型骨盆模型股骨模型下肢模型胫骨高位截骨术

一种基于集群知识蒸馏与自适应本地差分隐私的联邦学习双重优化方法及系统

集群知识客户端隐私保护能力蒸馏服务器

一种基于对抗剪枝和知识蒸馏的后门防御方法

站点导航

APP 下载