自动化大语言模型安全测试方法、装置、服务器及存储介质

AITNT
正文
推荐专利
自动化大语言模型安全测试方法、装置、服务器及存储介质
申请号:CN202511031950
申请日期:2025-07-25
公开号:CN120929372A
公开日期:2025-11-11
类型:发明专利
摘要
本申请公开了一种自动化大语言模型安全测试方法、装置、服务器及存储介质,属于网络技术领域。该方法通过将成功的攻击结果转换为越狱经验,并根据越狱漂移语义对这些经验进行分组,再根据每个组的历史成功率提炼出代表越狱模式和目标经验。测试过程中,利用这些经验对大语言模型进行安全测试,并根据测试结果动态更新目标经验,以提高测试效率和准确性。该方法有效消除了传统方法中的冗余优化问题,能够在不同场景下灵活应对安全测试,提升了大语言模型的安全性和测试的可行性。
技术关键词
大语言模型 动态更新 测试方法 轮廓系数 代表 语义向量 模式 自然语言文本 核心 服务器 可读存储介质 漏洞 场景 变异策略 指令 频率 测试模块 数据
系统为您推荐了相关专利信息
1
一种基于虚拟地球的海量模型几何、属性及语义的统一表达方法
表达方法 WGS84坐标系 三维虚拟地球 地理信息技术 矩阵
2
一种端子温度测量的智能电表及温度测量方法
智能电表 温度测量方法 控制单元 PCB板 模数转换器芯片
3
一种算子测试方法、设备及存储介质
计算机设备 人工智能芯片技术 模拟人工智能 数据 测试方法
4
新能源不确定性下的船舶能量实时优化方法及系统
储能系统荷电状态 DQN算法 太阳能光伏板 新能源船舶电力 充放电功率
5
一种多环境状态下的芯片性能测试方法及装置
历史运行信息 芯片性能测试方法 多环境 集成电路芯片技术 参数
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号