面向长文本场景的大语言模型安全风险评估方法、系统和设备

AITNT
正文
推荐专利
面向长文本场景的大语言模型安全风险评估方法、系统和设备
申请号:CN202411671767
申请日期:2024-11-21
公开号:CN119647621B
公开日期:2025-10-28
类型:发明专利
摘要
面向长文本场景的大语言模型安全风险评估方法、系统和设备,属于大语言模型技术领域,解决大语言模型在长文本场景的安全性保障严重不足,存在着极大的安全评估方法的缺口问题。本发明方法包括:大模型在面对长文本输入时,针对同一有害任务,评估其安全性表现是否与短文本场景下的评估结果一致。本发明利用短文本场景安全领域数据,自动化生成整体语义一致、长文本形式的有害内容,构建长文本场景安全风险评估数据集,识别模型在长文本场景下中的潜在安全风险。采用的长文本评估方法包含上下文学习、基于反向长度扩充和思维链的有害长文本生成技术、经过无偏估计处理的安全评估指标。本发明适用于评估大语言模型在长文本场景下的安全风险。
技术关键词
大语言模型 风险评估方法 场景 数据 指标 文本生成技术 风险评估系统 正确率 可读存储介质 总量 代表 存储器 摘要 范畴 计算机设备 索引 模块
系统为您推荐了相关专利信息
1
一种用于RPA工作流中分布式跟踪系统的尾部采样方法
分布式跟踪系统 采样方法 存储设备 重构 变分自动编码器
2
一种数据汇聚与融合方法
数据储存模组 物流中转站 融合方法 信息查询平台 物流运输设备控制
3
一种基于植被变化的城市暴雨洪水模型参数时变特征筛选方法、系统及存储介质
特征筛选方法 参数敏感性分析 地理信息系统软件 洪水模型构建 变量
4
一种用于汽车的车轮传动失稳动力再分配控制方法
分配控制方法 高精度传感器 车辆运行数据 车辆周围环境数据 车辆动力学模型
5
面向智慧景区的弹性云平台资源动态调度与多模态容灾方法
云平台资源 容灾方法 智慧景区 Kubernetes集群 数据中心
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号