一种面向大模型安全评测的评测样本自动生成方法及装置

正文

推荐专利

申请号：CN202411083246

申请日期：2024-08-08

公开号：CN119004104A

公开日期：2024-11-22

类型：发明专利

摘要

本发明提出一种面向大模型安全评测的评测样本自动生成方法和装置，包括：测评问题集包含多个用于测试大语言模型安全性的评测样本，以具有诱导内容的任务提示为输入，以该任务提示对应的该评测样本标签，微调训练大语言模型输出评测样本，得到评测样本生成模型；根据评测样本的安全风险类别，构建检索问句，检索互联网中属于该安全风险类别的数据资料；根据该安全风险类别以及该数据资料，合成提示文本；从该测评问题集中抽取属于该安全风险类别的评测样本填充至该提示文本后作为任务提示输入该评测样本生成模型，生成用于测试大语言模型的测试样本。

技术关键词

大语言模型自动生成方法样本生成装置信息显示设备风险互联网文本人工智能模型电子设备测试模块标签社交参数

系统为您推荐了相关专利信息

一种基于高阶注意力机制的脑肿瘤影像分割方法

影像分割方法注意力机制深度学习超参数脑肿瘤分割脑肿瘤图像

一种无文案图像检测方法、装置、电子设备及存储介质

文本像素点对象图像检测方法语义标签

基于小样本的多晶硅切割机金刚线跳线检测方法

多晶硅切割机跳线金刚线线网样本

车辆控制策略生成模型训练方法、设备、介质及程序产品

车辆控制策略网络记忆模型生成模型训练方法序列

一种当次检查后入院的预测分类模型

预测分类模型人口统计信息深度学习模型支持向量机分类器多源异构信息

一种面向大模型安全评测的评测样本自动生成方法及装置

站点导航

APP 下载