一种多智能体协同的大型语言模型伪装攻击方法及系统

AITNT
正文
推荐专利
一种多智能体协同的大型语言模型伪装攻击方法及系统
申请号:CN202510797146
申请日期:2025-06-16
公开号:CN120316769B
公开日期:2025-08-15
类型:发明专利
摘要
本发明公开了一种多智能体协同的大型语言模型伪装攻击方法及系统,属于大型语言模型安全技术领域,包括:根据攻击目标语义与被攻击语言模型,结合梯度优化获得词汇候选集,基于词汇候选集生成附加扰动词序列的初始攻击提示语;基于辅助语言模型对扰动词序列的每个位置进行语义候选生成操作,获得语义候选集合;基于语义候选集合与词汇候选集获得伪装扰动词序列,基于伪装扰动序列获得伪装提示语;将伪装提示语输入被攻击语言模型,验证生成响应与目标非法响应的匹配程度,根据验证结果反馈用于优化词汇候选集的信号。本发明通过多智能体协同联动,在攻击成功率与语言自然性之间实现动态均衡,显著提升对安全机制的规避能力与实际部署适应性。
技术关键词
语义 多智能体协同 序列 生成智能 字符 策略 解码方法 度函数 超参数 信号 检测器 变量 机制 动态
系统为您推荐了相关专利信息
1
基于双目视觉的低烟无卤线缆表面缺陷检测方法
低烟无卤线缆 低烟无卤电缆 表面缺陷检测方法 像素点 深度图
2
一种用于检测人类副流感病毒4型的LAMP引物组合、试剂盒和用途
人类副流感病毒 环介导等温扩增 引物 核苷酸 试剂盒
3
一种智能体避障导航方法及系统、存储介质、智能叉车
导航方法 动作策略 图像编码器 解码器 神经网络模型
4
一种建设工程咨询档案资料构建方法及系统
资料 实体 规划 词语 树根
5
一种基于大模型与运筹优化的智能任务规划方法
资源分配策略 规划 任务调度 资源需求数据 运筹优化技术
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号