基于注意力毒化的动态触发器文本后门攻击方法

AITNT
正文
推荐专利
基于注意力毒化的动态触发器文本后门攻击方法
申请号:CN202510538647
申请日期:2025-04-27
公开号:CN120407794A
公开日期:2025-08-01
类型:发明专利
摘要
本发明公开了一种基于注意力毒化的动态触发器文本后门攻击方法,属于人工智能安全技术领域,包括获取文本分类数据集D1、子数据集D2和分类神经网络;用D1训练分类神经网络得到文本分类模型;基于MLM任务、过滤阈值、综合评分和触发器选择模型构造毒化数据集D3;对文本分类模型和触发器选择模型进行联合后门训练;基于训练好的模型生成最终毒性样本。本发明在联合后门训练时不仅改变了后门模型权重,还增强了触发器选择模型的能力,使其能够更精准地选择具有更强毒性效果的触发词,并用触发器选择模型的输出控制后门模型中注意力层的输出,以此达成更为有效的毒化。这一创新性方法不仅加强了后门攻击的效果,也增加了其检测难度。
技术关键词
分类神经网络 文本分类模型 动态触发器 后门 样本 注意力 标签 预测类别 创新性方法 数据 矩阵 编码 超参数 元素 标记 阶段
系统为您推荐了相关专利信息
1
基于机器学习与统计推断的市场趋势预测方法
预测特征 机器学习模型 周期 指标 时序特征
2
企业的金融风险预测方法、装置、设备、介质及程序产品
集成学习框架 紧凑特征 编码器 学习器 监督学习模型
3
图像处理方法、装置和计算机设备
灰度直方图 图像处理方法 灰度级控制 待测对象 像素
4
深度学习的人工智能安全漏洞检测平台
检测平台 漏洞 量子随机数发生器 量子傅里叶变换 风险
5
隧道渗水检测识别方法、装置、设备及介质
图像样本数据库 隧道渗水检测 深度学习模型 隧道衬砌 实例分割
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号