一种针对大模型提示注入攻击的攻防一体化方法

正文

推荐专利

申请号：CN202510941601

申请日期：2025-07-09

公开号：CN120434064B

公开日期：2025-08-29

类型：发明专利

摘要

本发明提供了一种针对大模型提示注入攻击的攻防一体化方法，方法包括：使用基于情感强化和控制输出的攻击策略对用户指令进行大模型提示注入攻击，形成恶意内容；然后将预防策略Sandwich，Instruction和检测方法Knownanswer进行融合，构建协同工作的多层次防御策略UnD对上述恶意内容进行提示注入防御，得到输出结果，最后使用攻击干扰率、攻击误导率、METEOR得分、防御成功率、已知答案匹配率进行效果评估。本发明在攻击方面实现了攻击效率更高的提示注入攻击，在防御方面实现了检测和预防的协同，提高了大模型在面对提示注入攻击时的安全性，确保大语言模型在各种应用场景中安全可靠运行。

技术关键词

一体化方法字段指令样本答案策略多层次大语言模型语义符号定义意图文本场景基础数据

系统为您推荐了相关专利信息

基于GRU网络的数字预失真通信设备与实现方法

功率放大器模型数字预失真模型通信设备数据基带芯片

AMR移动机器人的顶升机构控制方法、系统、电子设备

顶升机构避障路径激光雷达传感器控制系统环境感知信息

一种数据处理方法、电子设备及数据处理系统

电子设备设备管理数据处理系统云服务器数据处理方法

一种基于产业平台交易数据匹配金融产品的方法及系统

匹配金融产品 XGBoost模型客户金融业务系统产业互联网平台

一种设备异常处理方法及设备、介质和计算机程序产品

异常设备现场勘察设备历史告警信息非易失性存储介质报警指示灯

一种针对大模型提示注入攻击的攻防一体化方法

站点导航

APP 下载