一种提示注入防御方法、系统、电子设备及存储介质

正文

推荐专利

申请号：CN202411962260

申请日期：2024-12-27

公开号：CN119886152B

公开日期：2025-11-18

类型：发明专利

摘要

本申请的实施例揭示了一种提示注入防御方法、系统、电子设备及存储介质，方法包括：对输入文本进行初步检测，得到初步检测结果；对输入文本进行语义分析生成语义理解分析报告；获取目标大语言模型的当前运行参数；根据当前运行参数，获取目标大语言模型的行为模式分析结果；根据所述初步检测结果、所述语义理解分析报告和所述行为模式分析结果，获取所述目标大语言模型的当前防御策略；本申请通过从输入文本和大语言模型的运行状态两个方面进行紧密结合，不仅可以准确检测出大模型受到的提示注入攻击以及高效防止大模型受到恶意攻击，并且在面对复杂的攻击场景时可以制定出相对应的防御策略，实现更有效的防御，提升整体防御系统的鲁棒性。

技术关键词

大语言模型文本语义语法结构序列计算机可读指令报告防御系统策略高风险注意力机制电子设备逻辑意图类别参数处理器

系统为您推荐了相关专利信息

基于知识图谱的政务文本数据分类处理系统及方法

政务图谱数据分类命名实体识别模型数据采集处理单元

内容处理方法、装置以及电子设备

电子设备索引大语言模型搜索词搜索控件

智能输入方法、设备、存储介质

字符语义语句智能输入方法 bert模型

一种基于多分支三维图卷积和LSTM的动作识别方法

动作识别模型动作识别方法多分支节点位置信息节点特征

考虑运行工况的变电设备状态评估概率图网络方法及系统

变电设备状态评估工况状态转移模型深度学习算法推理算法

一种提示注入防御方法、系统、电子设备及存储介质

站点导航

APP 下载