一种基于大模型安全性的测试方法

AITNT
正文
推荐专利
一种基于大模型安全性的测试方法
申请号:CN202411907948
申请日期:2024-12-23
公开号:CN119939593A
公开日期:2025-05-06
类型:发明专利
摘要
本申请属于模型测试技术领域,更具体地说,涉及一种基于大模型安全性的测试方法,通过收集并处理覆盖正常使用场景和边界场景的输入数据,确保测试数据的全面性和有效性。接着,利用FGSM方法生成初步对抗样本,并结合现有数据对模型进行测试,从而发现模型在不同场景下的脆弱点。随后,攻击者智能体根据模型的测试结果不断调整对抗样本,以最大化攻击效果,深入挖掘模型的安全漏洞。在持续监测过程中,监控模型生成文本的置信度变化,识别出对抗样本导致的高置信度错误输出,判定攻击成功。最后,通过对攻击结果的统计分析,全面评估模型在各类攻击下的脆弱性,从而为模型的优化和安全防护提供有力依据,显著提升电网领域智能模型的安全性和可靠性。
技术关键词
样本 空间模块 测试方法 模型测试技术 策略更新 数据 场景 智能模型 鲁棒性 学习方法 预测误差 文本 噪声 有效性 度量 符号 因子 动态
系统为您推荐了相关专利信息
1
场景生成和模型训练方法、装置、设备和程序产品
视频生成模型 时空注意力机制 空间结构 元素 噪声数据
2
支持重放及多模型管理的智能文本分类系统和方法
文本分类系统 分类标签体系 关联算法 多层级标签 分类语料库
3
变压器绕组振动信号确定方法、系统、存储介质及设备
经验模态分解算法 变压器箱体 变压器绕组 样条 参数
4
一种基于视频的无监督可见光红外行人重识别方法
查询特征 重识别方法 噪声样本 聚类 特征提取模块
5
一种基于依存句法的工程知识类型匹配方法、设备、存储介质及产品
依存句法 CRF模型 实体 Softmax函数 XML解析器
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号