可拓展的大语言模型越狱攻击方法、装置、介质和产品

正文

推荐专利

申请号：CN202411948089

申请日期：2024-12-26

公开号：CN119884311A

公开日期：2025-04-25

类型：发明专利

摘要

本申请涉及一种可拓展的大语言模型越狱攻击方法、装置、介质和产品，方法包括：获取与越狱任务对应的第一提示，并根据问题模板生成所述第一提示的第一回答数据；根据与所述越狱任务对应的角色描述和/或情境描述、预设的格式需求，更新预设的第一提示模板中的写入内容；以所述第一回答数据为示例，结合第一提示模板中的所述角色描述和/或情境描述对所述第一提示进行转写，得到符合所述格式需求的第二提示；获取目标大语言模型基于所述第二提示生成的第二回答数据。采用本方法能够解决大语言模型应对越狱攻击时的安全边界的评估范围狭窄的问题。

技术关键词

大语言模型模板数据格式参数计算机程序产品语义可读存储介质模块处理器指令

系统为您推荐了相关专利信息

基于三维激光的异形构件制造与安装误差校正方法及系统

异形构件安装误差校正方法多边形网格模型土建基础

一种测试用例生成系统构建方法及测试用例生成方法

测试用例生成系统框架模板测试用例数据空间变换网络语义特征

基于ABAQUS的复合材料固化树脂流动-压实过程模拟方法

复合材料结构渗流模型复合材料树脂渗透率参数纤维

水下集群协同围捕的通信调度方法及装置

通信调度方法集群通信调度装置主节点冗余

大模型应用的提示词安全加固方法、装置、设备和存储介质

受保护计算机可执行指令风险处理单元构建知识图谱

可拓展的大语言模型越狱攻击方法、装置、介质和产品

站点导航

APP 下载