摘要
本发明涉及大语言模型安全防护与对抗攻击领域领域,提出一种面向大语言模型抽取攻击的防御反击方法及系统,通过用户行为分析划分用户群体,以精准匹配应对策略,避免影响正常用户的使用体验,再通过针对性的内容处理策略,确保授信用户获得完整、准确的模型响应,保障其使用体验不受影响的同时,有效抑制可疑用户的攻击行为,并对恶意用户进行准确有效的防御和反击,又通过动态调节进行用户群体的更新,避免出现误判,增强了抗干扰能力和自修正能力,最后通过对完整周期的检测防护,持续进行防御反击,进一步的提高了保护的可靠性,本发明提高了面向大语言模型抽取攻击的防御反击的有效性和准确性。
技术关键词
大语言模型
交互内容
分析系统
生成提示词
语义
数据
意图
反击系统
样本
动态
计算机设备
指标
算法
模板
周期
存储器
处理器
网络设备
分析模块
策略
系统为您推荐了相关专利信息
能耗分析方法
多模态
时间对齐方法
设备状态数据
楼宇环境
语料生成方法
大语言模型
数据库表结构
自然语言
SQL模板
场景
生成方法
轮廓信息
文字信息输入系统
生成系统
注意力
Attention机制
语义
可读存储介质
文本生成模型