摘要
本发明提供基于对抗性样本检测的数据中毒攻击的防御方法,通过改进特征压缩与模型突变技术,实现多类型数据中毒攻击的通用防御。该方法首先使用干净的样本建立预训练模型,然后使用中毒样本对预训练模型进行训练,在模型训练的过程中使用特征压缩方法和模型突变方法来防御数据中毒的攻击。实验表明,本发明在CIFAR‑10数据集上对清洁标签中毒攻击的防御准确率达93.5%,显著优于传统方法,并且本发明可以防御多种类型的数据中毒攻击,适用于机器人视觉、自动驾驶等高安全需求场景。
技术关键词
对抗性
预训练模型
标签
变异方法
数据清理方法
像素
决策
特征值
协方差矩阵
颜色
深度神经网络架构
压缩图像信息
训练神经网络模型
鲁棒性
有损压缩方法
样本检测方法
噪声