摘要
本公开关于后门攻击方法、装置、电子设备、存储介质和计算机程序产品,该方法包括:获取文本集合;将文本集合输入后门判别器;在后门判别结果指示相应文本为干净文本的情况下,提取该文本的干净语义特征;否则,提取该文本的污染语义特征,并将污染语义特征与预设目标类别特征进行加权求和;将干净语义特征、融合语义特征和图像样本输入多模态检索系统,以进行跨模态检索。这样,通过针对原始文本进行风格迁移的方式来获取污染文本,即后门文本,可以避免因插入明显的触发词汇所导致的文本流畅性和语义连贯性被破坏的现象,进而可以有效降低被防御机制和人工检查发现的风险,从而可以提升后门攻击的隐蔽性和自然性。
技术关键词
文本
语义特征
后门
句法依存关系
风格
融合语义
检索系统
计算机程序产品
跨模态
电子设备
多模态
处理器
可读存储介质
特征提取模块
大语言模型
判别模块
样本
对象
图像
系统为您推荐了相关专利信息
分类优化方法
BERT模型
文本分类算法
命名实体识别
社会
语义特征
图像生成模型
图像结构信息
图像生成方法
计算机可执行指令
动态评估系统
非结构化文本
风险
协方差分析
三次样条插值
数据标签
生成标签
关键词提取模型
文本
数据获取模块