摘要
本申请涉及一种可拓展的大语言模型越狱攻击方法、装置、介质和产品,方法包括:获取与越狱任务对应的第一提示,并根据问题模板生成所述第一提示的第一回答数据;根据与所述越狱任务对应的角色描述和/或情境描述、预设的格式需求,更新预设的第一提示模板中的写入内容;以所述第一回答数据为示例,结合第一提示模板中的所述角色描述和/或情境描述对所述第一提示进行转写,得到符合所述格式需求的第二提示;获取目标大语言模型基于所述第二提示生成的第二回答数据。采用本方法能够解决大语言模型应对越狱攻击时的安全边界的评估范围狭窄的问题。
技术关键词
大语言模型
模板
数据
格式
参数
计算机程序产品
语义
可读存储介质
模块
处理器
指令
系统为您推荐了相关专利信息
异形构件
安装误差校正方法
多边形网格模型
土建
基础
测试用例生成系统
框架模板
测试用例数据
空间变换网络
语义特征
复合材料结构
渗流模型
复合材料树脂
渗透率参数
纤维
受保护
计算机可执行指令
风险
处理单元
构建知识图谱