面向长文本场景的大语言模型安全风险评估方法、系统和设备

正文

推荐专利

申请号：CN202411671767

申请日期：2024-11-21

公开号：CN119647621B

公开日期：2025-10-28

类型：发明专利

摘要

面向长文本场景的大语言模型安全风险评估方法、系统和设备，属于大语言模型技术领域，解决大语言模型在长文本场景的安全性保障严重不足，存在着极大的安全评估方法的缺口问题。本发明方法包括：大模型在面对长文本输入时，针对同一有害任务，评估其安全性表现是否与短文本场景下的评估结果一致。本发明利用短文本场景安全领域数据，自动化生成整体语义一致、长文本形式的有害内容，构建长文本场景安全风险评估数据集，识别模型在长文本场景下中的潜在安全风险。采用的长文本评估方法包含上下文学习、基于反向长度扩充和思维链的有害长文本生成技术、经过无偏估计处理的安全评估指标。本发明适用于评估大语言模型在长文本场景下的安全风险。

技术关键词

大语言模型风险评估方法场景数据指标文本生成技术风险评估系统正确率可读存储介质总量代表存储器摘要范畴计算机设备索引模块

系统为您推荐了相关专利信息

一种用于RPA工作流中分布式跟踪系统的尾部采样方法

分布式跟踪系统采样方法存储设备重构变分自动编码器

一种数据汇聚与融合方法

数据储存模组物流中转站融合方法信息查询平台物流运输设备控制

一种基于植被变化的城市暴雨洪水模型参数时变特征筛选方法、系统及存储介质

特征筛选方法参数敏感性分析地理信息系统软件洪水模型构建变量

一种用于汽车的车轮传动失稳动力再分配控制方法

分配控制方法高精度传感器车辆运行数据车辆周围环境数据车辆动力学模型

面向智慧景区的弹性云平台资源动态调度与多模态容灾方法

云平台资源容灾方法智慧景区 Kubernetes集群数据中心

面向长文本场景的大语言模型安全风险评估方法、系统和设备

站点导航

APP 下载