摘要
本发明提供的一种大模型提示词注入防御方法及装置,其方法包括:在提示词构建侧,获取用户的输入内容,根据所述输入内容识别得到输入风险类型,根据所述输入风险类型生成对应的安全预警内容,将所述安全预警内容添加到所述输入内容之后,构建输入提示,将所述输入提示发送至大语言模型;由大语言模型根据所述输入提示输入生成输出内容。本发明在用户的输入内容后置一段安全预警内容,以增强输入提示的安全性和有效性,确保了输入提示在进入大语言模型前经过强化和安全处理,减少了不安全提示对模型输出的影响,从而能够提高大语言模型的安全性。
技术关键词
风险
大语言模型
社交工程
关键词
会话
处理器
存储器
有效性
指令
系统为您推荐了相关专利信息
问答模型
问答方法
计算机程序指令
导航辅助信息
大语言模型
多源传感信息
建立通信
终端通信状态
深度学习模型
资源
考核方法
企业信用风险
决策树模型
机器学习统计模型
逻辑回归算法
风险预测系统
心肌肌钙蛋白
紫癜
风险评估模型
尿素氮