一种提示语盗取攻击的检测方法

AITNT
正文
推荐专利
一种提示语盗取攻击的检测方法
申请号:CN202510413557
申请日期:2025-04-02
公开号:CN120449882A
公开日期:2025-08-08
类型:发明专利
摘要
本说明书实施例公开了一种提示语盗取攻击的检测方法,将包含用户提示语和系统提示语的最终提示语输入大语言模型,检测大语言模型在输出结果的过程中,是否存在从最终提示语中读取至少部分系统提示语,并将读取的至少部分系统提示语作为至少部分输出的结果的操作,若是,则可确定用户提示语存在提示语盗取攻击的行为。该方法不需要依赖基于先验知识的拦截规则对存在提示语盗取攻击行为的用户提示语进行拦截,直接以大语言模型实际执行的操作为依据判断是否受到攻击,因此各种试图盗取系统提示语的用户提示语均难以绕过上述检测方法,可有效防御提示语盗取攻击。
技术关键词
大语言模型 服务端 拦截规则 处理器 程序 样本 输入模块 可读存储介质 指令 存储器 客户端 电子设备 日志 计算机 参数
系统为您推荐了相关专利信息
1
索引构建方法、装置、设备及计算机可读存储介质
索引构建方法 数据 梯度提升树模型 模拟退火算法 计算机可执行指令
2
一种5G信号的处理方法、装置、电子设备及可读介质
频段 神经网络模型 参数 消息 信号发送模块
3
基于超材料的四线圈电能变向无线增强传输装置和方法
超材料 接收线圈 线圈阵列 谐振电容 高频电源
4
一种基于标签感知注意力引导的关系抽取方法
关系抽取方法 注意力 标签 字符串匹配算法 大语言模型
5
一种基于热重实验的木质生物质水分蒸发速率计算及精度提升方法
精度提升方法 速率 加热 样品含水量 热重分析仪
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号