一种防御数据后门投毒的后门攻击检测提取方法及设备

正文

推荐专利

申请号：CN202410738257

申请日期：2024-06-07

公开号：CN118606942A

公开日期：2024-09-06

类型：发明专利

摘要

本发明涉及人工智能技术领域，为解决现有防御数据投毒攻击技术中存在的效率低、开销高的问题，公开了一种防御数据后门投毒的后门攻击检测与提取方法，为了成功从训练数据中提取后门触发器，将后门检测提取过程整合为多目标优化问题。为了使提取的后门触发器具有模型无关的特性，采用替代模型进行后门提取，并使用竞争性知识蒸馏方案训练替代模型，避免常规训练替代模型时存在的效果差、易过拟合的问题。最后设计序列元学习框架集成后门提取结果，提高后门的适用性。本发明可用于检测提取训练数据中可能存在的后门触发器，在面对数据投毒攻击时，数据提供方和使用方只需按照我们的方案进行对照检查，即可高效地防御数据投毒攻击。

技术关键词

后门检测提取方法数据教师防御算法梯度下降算法样本内外两层结构蒸馏模式神经网络训练人工智能技术定义处理器参数序列存储装置框架程序服务端

一种防御数据后门投毒的后门攻击检测提取方法及设备

站点导航

APP 下载