摘要
本申请公开了一种自动化大语言模型安全测试方法、装置、服务器及存储介质,属于网络技术领域。该方法通过将成功的攻击结果转换为越狱经验,并根据越狱漂移语义对这些经验进行分组,再根据每个组的历史成功率提炼出代表越狱模式和目标经验。测试过程中,利用这些经验对大语言模型进行安全测试,并根据测试结果动态更新目标经验,以提高测试效率和准确性。该方法有效消除了传统方法中的冗余优化问题,能够在不同场景下灵活应对安全测试,提升了大语言模型的安全性和测试的可行性。
技术关键词
大语言模型
动态更新
测试方法
轮廓系数
代表
语义向量
模式
自然语言文本
核心
服务器
可读存储介质
漏洞
场景
变异策略
指令
频率
测试模块
数据
系统为您推荐了相关专利信息
表达方法
WGS84坐标系
三维虚拟地球
地理信息技术
矩阵
智能电表
温度测量方法
控制单元
PCB板
模数转换器芯片
计算机设备
人工智能芯片技术
模拟人工智能
数据
测试方法
储能系统荷电状态
DQN算法
太阳能光伏板
新能源船舶电力
充放电功率
历史运行信息
芯片性能测试方法
多环境
集成电路芯片技术
参数