摘要
本发明公开了一种面向通用业务场景的人工智能模型安全性自动化评测方法,包括S1、用户提交被评测人工智能模型,以及指定训练被评测人工智能模型的原始数据集;S2、在对被评测人工智能模型进行白盒评测时,通过改进FGSM算法对原始数据集中的每个输入样本生成对应的对抗样本,构成对抗数据集;S3、调用被评测人工智能模型的接口对原始数据集进行预测;S4、在黑盒评测时,用户除需选择其他被评测人工智能模型在白盒评测过程中生成的对抗数据集外,其余过程均和白盒评测时一致;S5、最终得到对被评测人工智能模型的评测得分集合;S6、得到被评测人工智能模型的最终评分。本发明能够全面反映模型在不同攻击场景下的性能,提供客观和准确的评测结果。
技术关键词
人工智能模型
评测方法
样本
白盒
场景
算法
数据
标签
因子
接口
策略
代表
参数
符号
格式
元素
动态
系统为您推荐了相关专利信息
轨道安装方法
锚杆端部
轨道安装装置
神经网络预测模型
偏移特征
RNN模型
异常监测方法
样本
模型训练方法
分析报文
风险检测方法
风险点
图谱
内容分类
文本分类模型