一种基于大模型安全性的测试方法

正文

推荐专利

一种基于大模型安全性的测试方法

申请号：CN202411907948

申请日期：2024-12-23

公开号：CN119939593A

公开日期：2025-05-06

类型：发明专利

摘要

本申请属于模型测试技术领域，更具体地说，涉及一种基于大模型安全性的测试方法，通过收集并处理覆盖正常使用场景和边界场景的输入数据，确保测试数据的全面性和有效性。接着，利用FGSM方法生成初步对抗样本，并结合现有数据对模型进行测试，从而发现模型在不同场景下的脆弱点。随后，攻击者智能体根据模型的测试结果不断调整对抗样本，以最大化攻击效果，深入挖掘模型的安全漏洞。在持续监测过程中，监控模型生成文本的置信度变化，识别出对抗样本导致的高置信度错误输出，判定攻击成功。最后，通过对攻击结果的统计分析，全面评估模型在各类攻击下的脆弱性，从而为模型的优化和安全防护提供有力依据，显著提升电网领域智能模型的安全性和可靠性。

技术关键词

样本空间模块测试方法模型测试技术策略更新数据场景智能模型鲁棒性学习方法预测误差文本噪声有效性度量符号因子动态

系统为您推荐了相关专利信息

场景生成和模型训练方法、装置、设备和程序产品

视频生成模型时空注意力机制空间结构元素噪声数据

支持重放及多模型管理的智能文本分类系统和方法

文本分类系统分类标签体系关联算法多层级标签分类语料库

变压器绕组振动信号确定方法、系统、存储介质及设备

经验模态分解算法变压器箱体变压器绕组样条参数

一种基于视频的无监督可见光红外行人重识别方法

查询特征重识别方法噪声样本聚类特征提取模块

一种基于依存句法的工程知识类型匹配方法、设备、存储介质及产品

依存句法 CRF模型实体 Softmax函数 XML解析器

一种基于大模型安全性的测试方法

站点导航

APP 下载