针对大语言模型安全性能的通用评估方法

正文

推荐专利

针对大语言模型安全性能的通用评估方法

申请号：CN202411855909

申请日期：2024-12-17

公开号：CN119989354A

公开日期：2025-05-13

类型：发明专利

摘要

本发明公开了针对大语言模型安全性能的通用评估方法；包括如下步骤：S1、收集数据集；S2、收集大语言模型；S3、构建知识图谱；S4、对大语言模型进行微调；S5、制定阈值和评分规则；S6、生成测评数据；S7、对大语言模型进行测评；S8、分析大语言模型性能；本发明的评估方法不局限于某个环境、大模型的参数量以及大模型的功能，可以全面的评估任何大模型，即通过安全性评估的模型对待检测大语言模型的问答输出进行评估，领域测评数据是动态生成的，特定领域测评数据对待测大语言模型进行输出问答数据，并且领域测评数据独立于待测大语言模型的训练数据集，测评使用的数据集质量同时测评难以作弊，保证了测评结果的鲁棒性。

技术关键词

大语言模型构建知识图谱专用数据集实体生成知识图谱梯度下降算法关系答案自然语言场景数据存储鲁棒性格式动态

系统为您推荐了相关专利信息

基于多尺度空间注意力机制的单幅建筑图像反射伪影消除方法及系统

伪影消除方法感知损失函数注意力机制建筑组合式

一种事件知识图谱构建方法、装置和电子设备

实体知识图谱构建方法三元组关系知识图谱构建装置

一种数据脱敏方法及相关设备

数据访问请求数据脱敏方法脱敏策略终端位置风险

问答方法、设备和存储介质

互联网编码特征音频编码视频编码网络

一种检索文档嵌入特征的处理方法和装置

嵌入特征大语言模型标签文本输入端执行主体

针对大语言模型安全性能的通用评估方法

站点导航

APP 下载