一种基于思维链的大语言模型迁移对抗攻击方法及系统

正文

推荐专利

申请号：CN202410974720

申请日期：2024-07-19

公开号：CN118796981A

公开日期：2024-10-18

类型：发明专利

摘要

本发明公开了一种基于思维链的大语言模型迁移对抗攻击方法及系统，该方法首先选择原始数据集；其次基于对抗样本生成算法，通过OpenAttack攻击框架实现不同粒度级别的文本对抗攻击，获取具有扰动能力的对抗样本；然后基于CoT构造针对大模型的对抗迁移提示样本；最后利用构造的对抗提示对大模型进行攻击，以欺骗大模型获得错误输出，若模型产生与干净样本不同的输出则为攻击成功。本发明集成不同细粒度的对抗攻击算法，同时利用对抗样本在相似架构的模型之间的可迁移性，结合思维链技术实现针对大模型的对抗样本攻击，具有更优的攻击效果。

技术关键词

样本大语言模型深度神经网络模型生成算法对抗性指令数据框架文本模块接口

系统为您推荐了相关专利信息

基于降噪扩散概率模型的驾驶行为分类方法、装置及产品

样本上采样分类方法短时傅里叶变换重构误差

一种电网调度指令序列异常检测方法及系统

电网调度指令序列异常检测方法样本多层次语义特征

一种基于生理活动状态分析的高原供氧设备控制方法

供氧设备生理高原负荷指数

一种风电机组传动链在线故障诊断方法

风电机组传动链在线故障诊断方法教师样本多源特征

一种基于动态经验学习的GIS工作流优化方法

工作流优化方法工作流执行大语言模型动态自然语言

一种基于思维链的大语言模型迁移对抗攻击方法及系统

站点导航

APP 下载