一种基于多智能体强化学习的大模型安全漏洞检测方法

AITNT
正文
推荐专利
一种基于多智能体强化学习的大模型安全漏洞检测方法
申请号:CN202511274702
申请日期:2025-09-08
公开号:CN120805146B
公开日期:2025-11-28
类型:发明专利
摘要
本发明公开了一种基于多智能体强化学习的大模型安全漏洞检测方法,涉及人工智能安全技术领域。该检测方法包括:构建初始提示词集合、提示词生成智能体和提示词判别智能体;选择初始提示词输入提示词生成智能体,生成的新提示词输入目标大模型,得到第一模型输出;将新提示词和第一模型输出组成键值对输入提示词判别智能体,获取新提示词的综合得分,并将新提示词添加至初始提示词集合;重复更新初始提示词集合,获取优化提示词集合输入目标大模型,获取第二模型输出;对第二模型输出进行敏感信息识别,判断目标大模型的安全漏洞。该检测方法可有效发现大模型潜在的安全风险漏洞,有助于提升目标大模型的安全性。
技术关键词
安全漏洞检测方法 多智能体强化学习 生成智能 敏感信息识别 关键词 策略更新 文本生成模型 模板 语义 分词 对抗性 分析模块 高风险 大语言模型 语法结构 机制 样本 键值
系统为您推荐了相关专利信息
1
一种虚拟电厂资源协调优化控制方法、系统、设备及介质
协调优化控制方法 协调优化控制策略 储能设施 多智能体强化学习 发电量
2
目标数据的识别方法及装置
半监督聚类 训练识别模型 噪声数据 分词 识别方法
3
一种自适应门控残差连接的相关性虚假新闻检测方法
循环卷积神经网络 嵌入特征 文档特征 注意力 关键词
4
一种用于档案审核开放的敏感信息识别方法及系统
敏感信息识别方法 计算机可执行指令 多层次 识别模块 智能算法识别
5
事件信息处理方法、装置、电子设备及非易失性存储介质
事件信息处理方法 非易失性存储介质 自然语言 关键词 语义结构
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号