一种大模型输出内容安全测试方法及装置

正文

推荐专利

一种大模型输出内容安全测试方法及装置

申请号：CN202510841178

申请日期：2025-06-23

公开号：CN120781361A

公开日期：2025-10-14

类型：发明专利

摘要

本发明涉及大模型安全测试领域，具体提供了一种大模型输出内容安全测试方法及装置，具有如下步骤：S1、准备和管理测试所需的测试集、敏感词库和正则表达式；S2、读取测试集，根据测试集和大模型接口信息获取大模型输出结果；S3、根据敏感词库和正则表达式判断大模型输出内容是否安全；S4、利用大模型和定向Prompt根据大模型输出内容提取语义风险特征，并经置信度验证后，自动入库；S5、将每个请求的信息结果保存到文件中。与现有技术相比，本发明能够减少测试时间，提高评估效率；并利用大模型输出结果动态构建敏感词库的方法，可以有效评估大模型输出内容的安全性。

技术关键词

测试方法规则集机器可读程序生成测试用例对抗性重试机制语义特征动态高风险接口格式存储器处理器日志索引报告文本核心

一种大模型输出内容安全测试方法及装置

站点导航

APP 下载