目标语言模型安全评测方法及电子设备

正文

推荐专利

目标语言模型安全评测方法及电子设备

申请号：CN202511105793

申请日期：2025-08-08

公开号：CN120611386B

公开日期：2025-11-07

类型：发明专利

摘要

本发明提供了一种目标语言模型安全评测方法及电子设备，可以应用于网络空间安全技术领域。该方法包括：基于安全等级分类标准，对多个安全领域进行安全等级分类，得到分类结果；针对多个安全等级的每个安全等级，对至少一个安全领域进行测试题库构建，得到测试题库；根据攻击测试题库中至少一个测试题和拒答测试题库中至少一个测试题对目标语言模型进行模型应用安全测试，得到模型应用安全测试结果；基于风险能力测试用例对目标语言模型进行模型功能安全测试，得到模型功能安全测试结果，其中，风险能力测试用例用于测试目标语言模型的功能安全风险；根据模型应用安全测试结果和模型功能安全测试结果，生成目标语言模型的安全评估报告。

技术关键词

测试题数据安全评测方法风险漏洞电子设备报告模型更新合规性参数策略处理器病毒存储器接口关系

目标语言模型安全评测方法及电子设备

站点导航

APP 下载