基于大语言模型对抗性提示检测方法、设备及介质

正文

推荐专利

申请号：CN202510436673

申请日期：2025-04-09

公开号：CN120297419A

公开日期：2025-07-11

类型：发明专利

摘要

本发明公开了基于大语言模型对抗性提示检测方法、设备及介质，属于人工智能安全技术领域，本发明要解决的技术问题为如何克服现有技术中大语言模型安全防护过程中存在的静态规则滞后、人工维护成本高昂以及上下文理解不足的缺陷，实现动态、实时且高精度的对抗性提示检测，采用的技术方案为：特征提取：全面解析用户文本中的语义信息、结构信息以及上下文信息，提取语义特征、结构特征以及上下文特征，并对语义特征、结构特征以及上下文特征经Min‑Max归一化后拼接为128维联合向量，再将联合向量通过L1正则化逻辑回归模型进行特征选择，压缩至10维核心特征，剔除冗余信息；对抗性评分；动态防御。

技术关键词

大语言模型对抗性上下文特征高风险 BERT模型语义特征意图分类模型 DBSCAN密度聚类滑动窗口文本逻辑回归模型动态生成上下文感知实体规则推理引擎记录审计日志强化学习代理字符

系统为您推荐了相关专利信息

基于动态配对架构搜索的药物相互作用预测方法和装置

编码器大语言模型样本分子信息传递机制

一种基于物理感知分层图表示的蛋白质结合位点预测方法

位点预测方法理化特征蛋白质二级结构分层三角剖分算法

基于预定义算子的自动化数据操作流的生成方法及系统

语义向量表单数据处理算法生成提示词生成方法

信道资源分配方法、装置及设备

信道资源分配方法融合特征大语言模型多模态深度学习架构

基于类别中心对比学习的城市三维网格语义分割方法

面片语义分割方法语义分割网络嵌入特征上下文特征

基于大语言模型对抗性提示检测方法、设备及介质

站点导航

APP 下载