摘要
本公开涉及人工智能与自然语言处理领域,尤其涉及一种用于识别针对大语言模型的提示注入攻击的方法、模型及设备。所述方法包括:获取要输入到LLM的提示词;对提示词进行语义分析,得到语义分析结果;对提示词进行提示注入词检测,得到提示注入词检测结果;根据语义分析结果和提示注入词检测结果,分析提示词是否涉及提示注入攻击。本公开提出了一种结合语义分析和提示注入词检测的融合识别机制,专门用于识别针对LLM的提示注入攻击,从而提升对LLM提示注入攻击的防御能力。
技术关键词
语义
大语言模型
神经网络模型
计算机程序产品
处理器
自然语言
语句
可读存储介质
关键词
存储器
图谱
模块
机制
系统为您推荐了相关专利信息
业务建模方法
数据并行分发
多源异构数据
数据采集节点
计算机程序产品
精准监测系统
模板匹配算法
液位
润滑油液面
润滑油容器