一种提示语盗取攻击的检测方法

正文

推荐专利

一种提示语盗取攻击的检测方法

申请号：CN202510413557

申请日期：2025-04-02

公开号：CN120449882A

公开日期：2025-08-08

类型：发明专利

摘要

本说明书实施例公开了一种提示语盗取攻击的检测方法，将包含用户提示语和系统提示语的最终提示语输入大语言模型，检测大语言模型在输出结果的过程中，是否存在从最终提示语中读取至少部分系统提示语，并将读取的至少部分系统提示语作为至少部分输出的结果的操作，若是，则可确定用户提示语存在提示语盗取攻击的行为。该方法不需要依赖基于先验知识的拦截规则对存在提示语盗取攻击行为的用户提示语进行拦截，直接以大语言模型实际执行的操作为依据判断是否受到攻击，因此各种试图盗取系统提示语的用户提示语均难以绕过上述检测方法，可有效防御提示语盗取攻击。

技术关键词

大语言模型服务端拦截规则处理器程序样本输入模块可读存储介质指令存储器客户端电子设备日志计算机参数

系统为您推荐了相关专利信息

索引构建方法、装置、设备及计算机可读存储介质

索引构建方法数据梯度提升树模型模拟退火算法计算机可执行指令

一种5G信号的处理方法、装置、电子设备及可读介质

频段神经网络模型参数消息信号发送模块

基于超材料的四线圈电能变向无线增强传输装置和方法

超材料接收线圈线圈阵列谐振电容高频电源

一种基于标签感知注意力引导的关系抽取方法

关系抽取方法注意力标签字符串匹配算法大语言模型

一种基于热重实验的木质生物质水分蒸发速率计算及精度提升方法

精度提升方法速率加热样品含水量热重分析仪

一种提示语盗取攻击的检测方法

站点导航

APP 下载