一种多智能体协同的大型语言模型伪装攻击方法及系统

正文

推荐专利

申请号：CN202510797146

申请日期：2025-06-16

公开号：CN120316769B

公开日期：2025-08-15

类型：发明专利

摘要

本发明公开了一种多智能体协同的大型语言模型伪装攻击方法及系统，属于大型语言模型安全技术领域，包括：根据攻击目标语义与被攻击语言模型，结合梯度优化获得词汇候选集，基于词汇候选集生成附加扰动词序列的初始攻击提示语；基于辅助语言模型对扰动词序列的每个位置进行语义候选生成操作，获得语义候选集合；基于语义候选集合与词汇候选集获得伪装扰动词序列，基于伪装扰动序列获得伪装提示语；将伪装提示语输入被攻击语言模型，验证生成响应与目标非法响应的匹配程度，根据验证结果反馈用于优化词汇候选集的信号。本发明通过多智能体协同联动，在攻击成功率与语言自然性之间实现动态均衡，显著提升对安全机制的规避能力与实际部署适应性。

技术关键词

语义多智能体协同序列生成智能字符策略解码方法度函数超参数信号检测器变量机制动态

系统为您推荐了相关专利信息

基于双目视觉的低烟无卤线缆表面缺陷检测方法

低烟无卤线缆低烟无卤电缆表面缺陷检测方法像素点深度图

一种用于检测人类副流感病毒4型的LAMP引物组合、试剂盒和用途

人类副流感病毒环介导等温扩增引物核苷酸试剂盒

一种智能体避障导航方法及系统、存储介质、智能叉车

导航方法动作策略图像编码器解码器神经网络模型

一种建设工程咨询档案资料构建方法及系统

资料实体规划词语树根

一种基于大模型与运筹优化的智能任务规划方法

资源分配策略规划任务调度资源需求数据运筹优化技术

一种多智能体协同的大型语言模型伪装攻击方法及系统

站点导航

APP 下载