摘要
本发明涉及大语言模型安全领域,提供了一种基于重复输出的大模型海绵样本黑盒生成方法。旨在解决现有技术中海绵样本效果不佳、迁移性差及生成效率低下的问题。该方法通过构造具有循环结构的初始化样本,并设计专门诱导重复输出行为的损失函数,结合集成学习策略,在白盒环境中优化生成高迁移性海绵样本。该样本在黑盒目标模型中可有效诱导持续重复输出,显著增加资源消耗和响应延迟。本发明无需依赖目标模型内部信息,在黑盒场景下实现高效攻击,提升海绵样本的跨模型迁移能力和实际应用效果。
技术关键词
样本
海绵
字符
生成方法
集成学习策略
损失函数优化
生成机制
大语言模型
效应
定义
资源
索引
场景
序列
基础
数据
系统为您推荐了相关专利信息
数字孪生体
动态部署方法
服务器
网络切片架构
虚拟网络功能
分布式物联网设备
射频指纹识别方法
正交幅度调制信号
短时傅里叶变换
射频设备