一种大模型安全防护方法、装置及存储介质

正文

推荐专利

一种大模型安全防护方法、装置及存储介质

申请号：CN202510997127

申请日期：2025-07-18

公开号：CN120930134A

公开日期：2025-11-11

类型：发明专利

摘要

本发明公开了一种大模型安全防护方法：准备对抗性提示数据样本：定义对抗性提示的特征，包括提示泄漏和越狱攻击两种类型；从公开数据集和社区分享中提取已知的对抗性提示，通过人工构造和算法微调正常提示生成对抗性提示，整合成数据集并划分训练集和测试集；模型选择与训练：选择适合文本分类任务的机器学习模型；利用所述对抗性提示数据样本对模型进行对抗训练；设计代理逻辑，构建对抗提示检测器中间模块，该模块：通过前端接口接收用户请求；对接收到的请求进行解析；调用对抗性提示检测模块评估请求安全性；根据评估结果选择转发至大模型或直接返回错误响应；测试与迭代，验证对抗提示检测器中间模块功能并根据新增数据重新训练模型。

技术关键词

对抗性防护方法检测器机器学习模型代表训练数据样本大语言模型处理器逻辑模块索引文本分析单元非标准算法防护装置定义可读存储介质

系统为您推荐了相关专利信息

水网系统水资源-生态环境-经济社会协同方法及系统

水网系统情景协同方法样本构建系统

基于环境变化的水力发电机动态调控方法及系统

水力发电机动态调控方法特征提取模型指数动态调控系统

基于企业管理信息搭建智慧运营体系的平台

企业管理信息重构模块大数据分析引擎数据建模技术搭建模块

一种生理生化融合监测的精神压力量化评估方法及装置

微流控模块量化评估方法多层传感器评估装置可穿戴设备

基于太赫兹无线通信的接收端信号校正方法、设备及介质

信号校正方法接收端长短期记忆网络生成对抗网络机器学习模型

一种大模型安全防护方法、装置及存储介质

站点导航

APP 下载