摘要
本发明公开了一种基于频域扰动的深度神经网络模型后门防御方法。该方法将频域扰动与轻量级重训练相结合,通过频域扰动构造重训练样本,并通过轻量级重训练去除可疑模型中的后门。具体来说,通过对图像的幅值谱施加扰动并保持相位谱不变,生成频域变体数据集。结合轻量级的重训练过程,该模型被引导忽略那些可能蕴含后门攻击触发器的高频段信息,最终得到愈合模型。修复后的模型可以有效地抵抗敌手发起的后门攻击,并且包含触发器的污染样本可以很高概率地被识别为正确的类别。与大多数相关工作相比,所提出的方案具有明显的优势。
技术关键词
深度神经网络模型
后门
样本
基础构造
数据
图像
深度学习理论
频率
调节噪声
预训练模型
频段
语义特征
参数
尺寸
矩阵
训练集
坐标
定义
系统为您推荐了相关专利信息
可视化方法
可视化组件
数据
计算机可读指令
统计算法
人脸识别模型
数据分类模型
传感器阵列
多模态协同
公交车
神经网络算法
数据处理系统
智能诊断系统
人工智能模型
输电线路故障诊断