自动化大语言模型安全测试方法、装置、服务器及存储介质

正文

推荐专利

申请号：CN202511031950

申请日期：2025-07-25

公开号：CN120929372A

公开日期：2025-11-11

类型：发明专利

摘要

本申请公开了一种自动化大语言模型安全测试方法、装置、服务器及存储介质，属于网络技术领域。该方法通过将成功的攻击结果转换为越狱经验，并根据越狱漂移语义对这些经验进行分组，再根据每个组的历史成功率提炼出代表越狱模式和目标经验。测试过程中，利用这些经验对大语言模型进行安全测试，并根据测试结果动态更新目标经验，以提高测试效率和准确性。该方法有效消除了传统方法中的冗余优化问题，能够在不同场景下灵活应对安全测试，提升了大语言模型的安全性和测试的可行性。

技术关键词

大语言模型动态更新测试方法轮廓系数代表语义向量模式自然语言文本核心服务器可读存储介质漏洞场景变异策略指令频率测试模块数据

系统为您推荐了相关专利信息

一种基于虚拟地球的海量模型几何、属性及语义的统一表达方法

表达方法 WGS84坐标系三维虚拟地球地理信息技术矩阵

一种端子温度测量的智能电表及温度测量方法

智能电表温度测量方法控制单元 PCB板模数转换器芯片

一种算子测试方法、设备及存储介质

计算机设备人工智能芯片技术模拟人工智能数据测试方法

新能源不确定性下的船舶能量实时优化方法及系统

储能系统荷电状态 DQN算法太阳能光伏板新能源船舶电力充放电功率

一种多环境状态下的芯片性能测试方法及装置

历史运行信息芯片性能测试方法多环境集成电路芯片技术参数

自动化大语言模型安全测试方法、装置、服务器及存储介质

站点导航

APP 下载