摘要
本发明涉及生成式人工智能,提供了一种基于PABA自适应触发器的干净标签后门攻击方法及装置。目的在于通过生成自适应触发器的对抗博弈训练方法,实现高效隐蔽的干净标签后门攻击,主要方案包括S10:构建触发器生成器、判别器和代理模型,收集与目标标签数据相关的代理数据集;S20:将本地目标标签数据与代理数据集合成聚合数据集,训练判别器区分中毒数据与干净数据;S30:使用触发器生成器对本地目标标签数据进行中毒处理,结合聚合数据集训练代理模型;S40:通过联合判别器的二分类损失和代理模型的交叉熵损失,对抗式优化触发器生成器;S50:循环执行步骤S20‑S40直至各模块收敛,生成可迁移至受害者模型的自适应触发器。
技术关键词
标签
神经网络架构
分类准确率
卷积神经网络结构
网络爬虫技术
梯度下降算法
后门
模块
数据中心
参数
标记
语义
样本
误差
动态
图像
强度
系统为您推荐了相关专利信息
融合特征
视觉方法
神经网络架构
光源色温
多场景
原始查询语句
语句转换方法
SQL模板
查询意图
槽位识别