摘要
本发明涉及人工智能技术领域,为解决现有防御数据投毒攻击技术中存在的效率低、开销高的问题,公开了一种防御数据后门投毒的后门攻击检测与提取方法,为了成功从训练数据中提取后门触发器,将后门检测提取过程整合为多目标优化问题。为了使提取的后门触发器具有模型无关的特性,采用替代模型进行后门提取,并使用竞争性知识蒸馏方案训练替代模型,避免常规训练替代模型时存在的效果差、易过拟合的问题。最后设计序列元学习框架集成后门提取结果,提高后门的适用性。本发明可用于检测提取训练数据中可能存在的后门触发器,在面对数据投毒攻击时,数据提供方和使用方只需按照我们的方案进行对照检查,即可高效地防御数据投毒攻击。
技术关键词
后门
检测提取方法
数据
教师
防御算法
梯度下降算法
样本
内外两层结构
蒸馏
模式
神经网络训练
人工智能技术
定义
处理器
参数
序列
存储装置
框架
程序
服务端