摘要
本发明公开了基于大语言模型对抗性提示检测方法、设备及介质,属于人工智能安全技术领域,本发明要解决的技术问题为如何克服现有技术中大语言模型安全防护过程中存在的静态规则滞后、人工维护成本高昂以及上下文理解不足的缺陷,实现动态、实时且高精度的对抗性提示检测,采用的技术方案为:特征提取:全面解析用户文本中的语义信息、结构信息以及上下文信息,提取语义特征、结构特征以及上下文特征,并对语义特征、结构特征以及上下文特征经Min‑Max归一化后拼接为128维联合向量,再将联合向量通过L1正则化逻辑回归模型进行特征选择,压缩至10维核心特征,剔除冗余信息;对抗性评分;动态防御。
技术关键词
大语言模型
对抗性
上下文特征
高风险
BERT模型
语义特征
意图分类模型
DBSCAN密度聚类
滑动窗口
文本
逻辑回归模型
动态
生成上下文感知
实体
规则推理引擎
记录审计日志
强化学习代理
字符
系统为您推荐了相关专利信息
位点预测方法
理化特征
蛋白质二级结构
分层
三角剖分算法
语义向量
表单
数据处理算法
生成提示词
生成方法
信道资源分配方法
融合特征
大语言模型
多模态
深度学习架构
面片
语义分割方法
语义分割网络
嵌入特征
上下文特征