基于虚假演示的隐藏后门提示攻击方法

正文

推荐专利

基于虚假演示的隐藏后门提示攻击方法

申请号：CN202510375764

申请日期：2025-03-27

公开号：CN120146149A

公开日期：2025-06-13

类型：发明专利

摘要

本发明公开一种基于虚假演示的隐藏后门提示攻击方法，本发明主要通过重构提示的语义和结构特征，将看似正常的提示转化为隐蔽的触发器，攻击者在不修改输入内容与标签的前提下，设计具有特殊语义模式的中毒提示，并嵌入演示示例中，当模型通过上下文学习解析这些示例时，其类比推理能力会自发建立中毒提示与目标标签的隐性关联，形成“后门”逻辑。本发明将提示整体作为触发器来激活后门行为，利用特殊设计的提示作为演示示例来引导模型学习特定的触发模式，通过改变演示示例中提示的表达方式，攻击者能够在不修改用户输入的情况下激活后门行为，显著提高后门的隐蔽性和攻击成功率。

技术关键词

隐藏后门注意力语义模板组合双重验证机制模式匹配预训练语言模型标签文本句法结构大语言模型模板结构样本同义词序列标识符令牌

系统为您推荐了相关专利信息

汽车压铸件图像的异常检测方法、装置、设备及存储介质

汽车压铸件图像异常检测方法特征提取模块特征提取单元

一种基于深度学习的舞蹈动作评估方法

动作评估方法骨骼关键点多模态传感器动态时间弯曲归一化方法

一种基于强化学习的水电厂尾水位预测方法

水位预测方法注意力机制强化学习算法 LSTM模型因子

一种处理方法、智能终端及存储介质

元素智能终端风格主题图像识别技术识别

一种基于大语言模型的多维提示优化的蒙汉神经机器翻译方法

蒙汉神经机器翻译方法大语言模型蒙古语关键词平行语料库

基于虚假演示的隐藏后门提示攻击方法

站点导航

APP 下载