摘要
本说明书实施例公开了一种提示注入攻击防御方法、装置、存储介质及电子设备,首先,在检测到向部署的大语言模型发起的当前提问请求时,通过预注入的安全切面服务拦截所述当前提问请求,并通过安全切面服务对当前提问请求进行伪装指令消除,得到目标提问请求,将目标提问请求输入到大语言模型中,以确定当前提问请求对应的安全回答反馈数据。本技术方案能够有效避免提示注入攻击,且不依赖于专家先验知识,提升提示注入攻击的防御准确性,提升大语言模型服务的安全性;同时,基于安全切面服务也不需要调整大语言模型的基础架构,有效降低提示注入攻击防御的工作量,降低成本,且安全切面服务的防御响应迅速,进一步提升安全性。
技术关键词
攻击防御方法
大语言模型
指令
模版
意图识别
标识符
自然语言预处理
攻击防御装置
数据
语义
电子设备
坐标
计算机程序产品
处理器
样本
无监督
存储器
模块
工作量
系统为您推荐了相关专利信息
时序
电价预测方法
计算机设备
数据获取模块
电力
空间图像信息
神经网络模型
序列文库
基因
序列特征
控制平台
监测模块
数据采集模块
路面结构层
无线摄像头