一种基于反向遗忘的后门防御方法及系统

正文

推荐专利

一种基于反向遗忘的后门防御方法及系统

申请号：CN202510520160

申请日期：2025-04-24

公开号：CN120030542B

公开日期：2025-06-27

类型：发明专利

摘要

本发明公开一种基于反向遗忘的后门防御方法及系统，属于人工智能安全领域；方法包括：利用原始干净样本集合训练预训练模型，并使用预训练模型从污染数据集中筛选出潜在干净样本集合，来合成新的干净样本集合，并使用新的干净样本集合对预训练模型进一步训练；将污染数据集和所述新的干净样本集合输入样本检测模型中，并分别采用交叉熵损失和熵约束进行训练；将污染数据集输入训练后的样本检测模型进行预测，来检测毒化样本。该方法对干净样本的模型特征表现进行反向遗忘，突出后门毒化样本的本体特征，而非直接寻找毒化样本的特征进行判别，从而对更新的样本中毒方法有着更加稳定的防御效果，脱离了传统后门检测方法的局限性。

技术关键词

样本预训练模型后门检测方法数据通信接口模型训练模块计算机存储介质梯度下降法防御系统计算机程序产品存储器标签处理器指令信息熵变量电子设备

系统为您推荐了相关专利信息

一种基于分层多模态融合的在线物联网设备固件识别方法

特征提取模块跨模态物联网设备识别方法多模态特征融合

一种用于人力资源智能终端的员工服务管理方法及系统

人力资源智能员工动态规则引擎服务管理方法画像

一种医疗区块链用的身份识别设备

身份识别设备转换算法设备主体移动底座区块链系统

一种基于微服务架构的故障隔离与快速恢复系统

微服务架构恢复系统自动化故障检测容器化技术机器学习算法

非接触式心率监测的样本生成方法、心率监测方法及系统

样本生成方法扩充训练样本非接触式心率亮度红外摄像头

一种基于反向遗忘的后门防御方法及系统

站点导航

APP 下载