摘要
本发明属于人工智能技术领域,公开了一种大模型间接提示注入防御方法及相关装置;其中,所述大模型间接提示注入防御方法包括:步骤1,获取系统提示、用户指令、工具调用、结果返回并输入大模型,获得注意力分数并利用IPI攻击检测器进行IPI攻击检测,获得攻击检测结果并进行判断:攻击检测结果为未检测到攻击时,将大模型基于用户指令生成的初始回复作为最终回复输出;攻击检测结果为检测到攻击时,跳转执行步骤2;步骤2,基于各部分注意力分数赋予不同的权重以实现注意力重分布并生成处理后回复,将处理后回复作为最终回复输出。本发明公开的技术方案,能够保留大模型自身有用性能,且可普适于各参数量级的大模型。
技术关键词
注意力
分布特征
检测器
样本
分类器
超参数
非暂态计算机可读存储介质
指令
人工智能技术
支持向量机
防御系统
处理器
搜索算法
模块
元素
存储器
训练集
电子设备
总量
系统为您推荐了相关专利信息
识别模型训练方法
样本
深度学习模型
像素点
塑料老化
故障率预测方法
计量终端
注意力机制
表计
设备运行参数
题目推荐方法
知识点
推荐学习课程
前馈神经网络
神经网络模型
风电出力预测方法
矩阵
前馈神经网络
注意力机制
序列
不确定性分析方法
产品碳足迹
样本
剔除噪声
参数