基于动态扩展和兜底机制的中文大语言模型安全评估系统及方法

正文

推荐专利

申请号：CN202510506470

申请日期：2025-04-22

公开号：CN120470278A

公开日期：2025-08-12

类型：发明专利

摘要

本发明提供一种基于动态扩展和兜底机制的中文大语言模型安全评估系统及方法，属于自然语言处理和人工智能领域。本发明基于现有基准测试数据集，通过大语言模型结合多种攻击方法生成攻击测试数据集，通过兜底机制，对被模型拒绝响应的请求，利用微调的专家模型生成攻击测试数据；再构造其对应的假阳性测试数据集，将攻击测试数据集和假阳性测试数据集输入到待评测中文大语言模型，进行推理并获得输出结果；最后对输出结果进行多维度评估并自动生成报告。本发明具有良好的可扩展性和适应性，能够动态地扩展测试数据集，跟进新兴的安全威胁，并有效避免过敏反应和生成有害内容；为中文大语言模型的安全性评估提供了更为灵活、全面和高效的解决方案。

技术关键词

大语言模型数据获取模块内容评估评估系统基准扩展测试数据对抗性梯度下降算法机制生成报告输入错误动态模版测试模块自然语言功能模块风险

系统为您推荐了相关专利信息

一种汽车造型设计方法、系统、电子设备及存储介质

汽车造型设计深度神经网络眼动追踪技术指标混合分析方法

一种基于大语言模型的多模态文旅知识库应答方法及系统

大语言模型文本图片旅游信息服务 Web用户界面

用于大语言模型的张量核系统及硬件芯片

矩阵浮点数大语言模型总线控制单元数据

一种田间秸秆覆盖量的估算方法、装置、设备及介质

秸秆覆盖量采样点随机森林模型混沌粒子群指数

一种隧道钢格栅自动焊接方法、设备及存储介质

隧道钢格栅光流场融合图像特征自动焊接方法像素点

基于动态扩展和兜底机制的中文大语言模型安全评估系统及方法

站点导航

APP 下载