基于大语言模型对抗性提示检测方法、设备及介质

AITNT
正文
推荐专利
基于大语言模型对抗性提示检测方法、设备及介质
申请号:CN202510436673
申请日期:2025-04-09
公开号:CN120297419A
公开日期:2025-07-11
类型:发明专利
摘要
本发明公开了基于大语言模型对抗性提示检测方法、设备及介质,属于人工智能安全技术领域,本发明要解决的技术问题为如何克服现有技术中大语言模型安全防护过程中存在的静态规则滞后、人工维护成本高昂以及上下文理解不足的缺陷,实现动态、实时且高精度的对抗性提示检测,采用的技术方案为:特征提取:全面解析用户文本中的语义信息、结构信息以及上下文信息,提取语义特征、结构特征以及上下文特征,并对语义特征、结构特征以及上下文特征经Min‑Max归一化后拼接为128维联合向量,再将联合向量通过L1正则化逻辑回归模型进行特征选择,压缩至10维核心特征,剔除冗余信息;对抗性评分;动态防御。
技术关键词
大语言模型 对抗性 上下文特征 高风险 BERT模型 语义特征 意图分类模型 DBSCAN密度聚类 滑动窗口 文本 逻辑回归模型 动态 生成上下文感知 实体 规则推理引擎 记录审计日志 强化学习代理 字符
系统为您推荐了相关专利信息
1
基于动态配对架构搜索的药物相互作用预测方法和装置
编码器 大语言模型 样本 分子 信息传递机制
2
一种基于物理感知分层图表示的蛋白质结合位点预测方法
位点预测方法 理化特征 蛋白质二级结构 分层 三角剖分算法
3
基于预定义算子的自动化数据操作流的生成方法及系统
语义向量 表单 数据处理算法 生成提示词 生成方法
4
信道资源分配方法、装置及设备
信道资源分配方法 融合特征 大语言模型 多模态 深度学习架构
5
基于类别中心对比学习的城市三维网格语义分割方法
面片 语义分割方法 语义分割网络 嵌入特征 上下文特征
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号