基于注意力毒化的动态触发器文本后门攻击方法

正文

推荐专利

申请号：CN202510538647

申请日期：2025-04-27

公开号：CN120407794A

公开日期：2025-08-01

类型：发明专利

摘要

本发明公开了一种基于注意力毒化的动态触发器文本后门攻击方法，属于人工智能安全技术领域，包括获取文本分类数据集D1、子数据集D2和分类神经网络；用D1训练分类神经网络得到文本分类模型；基于MLM任务、过滤阈值、综合评分和触发器选择模型构造毒化数据集D3；对文本分类模型和触发器选择模型进行联合后门训练；基于训练好的模型生成最终毒性样本。本发明在联合后门训练时不仅改变了后门模型权重，还增强了触发器选择模型的能力，使其能够更精准地选择具有更强毒性效果的触发词，并用触发器选择模型的输出控制后门模型中注意力层的输出，以此达成更为有效的毒化。这一创新性方法不仅加强了后门攻击的效果，也增加了其检测难度。

技术关键词

分类神经网络文本分类模型动态触发器后门样本注意力标签预测类别创新性方法数据矩阵编码超参数元素标记阶段

系统为您推荐了相关专利信息

基于机器学习与统计推断的市场趋势预测方法

预测特征机器学习模型周期指标时序特征

企业的金融风险预测方法、装置、设备、介质及程序产品

集成学习框架紧凑特征编码器学习器监督学习模型

图像处理方法、装置和计算机设备

灰度直方图图像处理方法灰度级控制待测对象像素

深度学习的人工智能安全漏洞检测平台

检测平台漏洞量子随机数发生器量子傅里叶变换风险

隧道渗水检测识别方法、装置、设备及介质

图像样本数据库隧道渗水检测深度学习模型隧道衬砌实例分割

基于注意力毒化的动态触发器文本后门攻击方法

站点导航

APP 下载