摘要
本公开提供了一种模型的安全测试方法、电子设备、可读存储介质及计算机程序产品。本公开的模型的安全测试方法包括:获取安全测试题;触发攻击任务,攻击任务用于将安全测试题输入待测模型,并获取待测模型输出的答复内容;对答复内容进行风险评估,得到风险评估结果;响应于风险评估结果表征不存在风险,基于答复内容和风险评估结果对安全测试题进行优化,得到优化后测试题,优化后测试题能够掩盖安全测试意图;将优化后测试题作为攻击任务中的安全测试题,并再次触发攻击任务并确定触发次数;以及响应于攻击任务的触发次数达到触发次数阈值,终止攻击任务的触发以完成待测模型的一次安全测试。
技术关键词
测试题
测试方法
风险
测试意图
计算机程序产品
语义向量
可读存储介质
策略
电子设备
处理器
存储器
指令
情景
图谱
身份
场景