一种基于触发器重建的后门防御方法

正文

推荐专利

一种基于触发器重建的后门防御方法

申请号：CN202411849440

申请日期：2024-12-16

公开号：CN119903888A

公开日期：2025-04-29

类型：发明专利

摘要

本发明公开了一种基于触发器重建的后门防御方法，给定一个后门模型，使用少量干净样本通过目标函数对每个类别进行触发器重建，使模型将所有附加有触发器的图像样本分类为目标标签；引入模型可解释性技术对所有重建的触发器进行裁剪，以去除噪音，得到更真实的触发器；使用Logits分析区分后门触发器与自然触发器；利用后门触发器在干净模型上的无效性与自然触发器在相似模型上的有效性构建检测模型，区分后门触发器与自然触发器；使用检测出的后门触发器进行对抗性训练以移除模型后门。本发明使用logits分析与两个性质识别后门触发器，提高了检测的正确率；最后使用对抗性学习方法使得模型“遗忘”学习到的后门，以达到去除后门的效果。

技术关键词

后门样本标签对抗性图像检测模型训练蒸馏学生有效性像素点学习方法教师正确率矩阵颜色代表重构图案元素

系统为您推荐了相关专利信息

一种基于计算机视觉的滑环室碳刷打火智能检测方法

智能检测方法集电环碳刷滑环室计算机视觉注意力机制

智能交互设备的控制方法、智能交互设备及介质

智能交互设备人物模型视频语音生物特征信息

校园体育项目测试分析的自动化成绩记录和标准化动作评估方法及系统

体育项目测试动作评估方法成绩平板设备人体骨骼关键点

数据回流研判方法、装置、设备及存储介质

置信度阈值多模态图文图像非临时性计算机可读存储介质

基于衣剪与人体视觉模型的三维人体网格估计方法及系统

人体轮廓信息解码器裁剪模块网格

一种基于触发器重建的后门防御方法

站点导航

APP 下载