可拓展的大语言模型越狱攻击方法、装置、介质和产品

AITNT
正文
推荐专利
可拓展的大语言模型越狱攻击方法、装置、介质和产品
申请号:CN202411948089
申请日期:2024-12-26
公开号:CN119884311A
公开日期:2025-04-25
类型:发明专利
摘要
本申请涉及一种可拓展的大语言模型越狱攻击方法、装置、介质和产品,方法包括:获取与越狱任务对应的第一提示,并根据问题模板生成所述第一提示的第一回答数据;根据与所述越狱任务对应的角色描述和/或情境描述、预设的格式需求,更新预设的第一提示模板中的写入内容;以所述第一回答数据为示例,结合第一提示模板中的所述角色描述和/或情境描述对所述第一提示进行转写,得到符合所述格式需求的第二提示;获取目标大语言模型基于所述第二提示生成的第二回答数据。采用本方法能够解决大语言模型应对越狱攻击时的安全边界的评估范围狭窄的问题。
技术关键词
大语言模型 模板 数据 格式 参数 计算机程序产品 语义 可读存储介质 模块 处理器 指令
系统为您推荐了相关专利信息
1
基于三维激光的异形构件制造与安装误差校正方法及系统
异形构件 安装误差校正方法 多边形网格模型 土建 基础
2
一种测试用例生成系统构建方法及测试用例生成方法
测试用例生成系统 框架模板 测试用例数据 空间变换网络 语义特征
3
基于ABAQUS的复合材料固化树脂流动-压实过程模拟方法
复合材料结构 渗流模型 复合材料树脂 渗透率参数 纤维
4
水下集群协同围捕的通信调度方法及装置
通信调度方法 集群 通信调度装置 主节点 冗余
5
大模型应用的提示词安全加固方法、装置、设备和存储介质
受保护 计算机可执行指令 风险 处理单元 构建知识图谱
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号