一种基于思维链的大模型安全防护方法

正文

推荐专利

一种基于思维链的大模型安全防护方法

申请号：CN202510062744

申请日期：2025-01-15

公开号：CN119989408A

公开日期：2025-05-13

类型：发明专利

摘要

本发明是一种基于思维链的大模型安全防护方法，适用于增强各类大语言模型的防御能力且无需额外的后训练开销。本发明涉及大模型安全防护技术领域，通过大语言模型安全防御系统提示词增强，确保生成安全的回复；基于零样本思维链的安全防御后缀，应对越狱攻击；通过计算越狱攻击成功率，来对大语言模型的安全性进行评估。本发明采用的基于思维链的大语言模型安全防护方法包含了安全系统提示词和零样本思维链两部分。本发明不引入额外的计算成本，而是充分利用大语言模型的推理能力来抵御越狱攻击，极大地增强了大语言模型的安全防护能力，确保大模型在不同应用场景下的稳定运行和安全使用。

技术关键词

大语言模型防护方法防御系统样本修改系统逻辑分析防护系统模块处理器计算机设备场景可读存储介质存储器定义文本机制阶段程序

系统为您推荐了相关专利信息

基于强化学习的语音驱动三维人脸动画生成方法及装置

三维人脸表情智能体模型语音特征情绪特征三维人脸动画

一种基于遥感技术的工程地质勘查与评估方法

数字高程模型工程地质勘查地形特征遥感技术激光雷达

一种对旋轴流风机多目标多部件一体化优化方法及设备

一体化优化方法轴流风机多部件拉丁超立方采样数值仿真

一种基于尾翼布局的喷流干扰控制优化设计方法及系统

优化设计方法仿真模型尾翼布局数据模块

深度图像质量增强模型训练方法、系统、设备及介质

模型训练方法可见光图像跨模态生成器网络模型训练系统

一种基于思维链的大模型安全防护方法

站点导航

APP 下载