摘要
面向长文本场景的大语言模型安全风险评估方法、系统和设备,属于大语言模型技术领域,解决大语言模型在长文本场景的安全性保障严重不足,存在着极大的安全评估方法的缺口问题。本发明方法包括:大模型在面对长文本输入时,针对同一有害任务,评估其安全性表现是否与短文本场景下的评估结果一致。本发明利用短文本场景安全领域数据,自动化生成整体语义一致、长文本形式的有害内容,构建长文本场景安全风险评估数据集,识别模型在长文本场景下中的潜在安全风险。采用的长文本评估方法包含上下文学习、基于反向长度扩充和思维链的有害长文本生成技术、经过无偏估计处理的安全评估指标。本发明适用于评估大语言模型在长文本场景下的安全风险。
技术关键词
大语言模型
风险评估方法
场景
数据
指标
文本生成技术
风险评估系统
正确率
可读存储介质
总量
代表
存储器
摘要
范畴
计算机设备
索引
模块
系统为您推荐了相关专利信息
分布式跟踪系统
采样方法
存储设备
重构
变分自动编码器
数据储存模组
物流中转站
融合方法
信息查询平台
物流运输设备控制
特征筛选方法
参数敏感性分析
地理信息系统软件
洪水模型构建
变量
分配控制方法
高精度传感器
车辆运行数据
车辆周围环境数据
车辆动力学模型
云平台资源
容灾方法
智慧景区
Kubernetes集群
数据中心