用于识别针对大语言模型的提示注入攻击的方法、模型及设备

正文

推荐专利

申请号：CN202510448001

申请日期：2025-04-10

公开号：CN120371961A

公开日期：2025-07-25

类型：发明专利

摘要

本公开涉及人工智能与自然语言处理领域，尤其涉及一种用于识别针对大语言模型的提示注入攻击的方法、模型及设备。所述方法包括：获取要输入到LLM的提示词；对提示词进行语义分析，得到语义分析结果；对提示词进行提示注入词检测，得到提示注入词检测结果；根据语义分析结果和提示注入词检测结果，分析提示词是否涉及提示注入攻击。本公开提出了一种结合语义分析和提示注入词检测的融合识别机制，专门用于识别针对LLM的提示注入攻击，从而提升对LLM提示注入攻击的防御能力。

技术关键词

语义大语言模型神经网络模型计算机程序产品处理器自然语言语句可读存储介质关键词存储器图谱模块机制

系统为您推荐了相关专利信息

一种履带底盘的控制方法、装置、电子设备及存储介质

履带底盘比例积分控制算法传感器动力源周期

基于变量重要性分析的代码模型鲁棒性评估方法及系统

鲁棒性评估方法变量样本标签方式搜索方法

基于AI模型和服务编排的业务建模方法及计算机程序产品

业务建模方法数据并行分发多源异构数据数据采集节点计算机程序产品

一种基于图像识别的智能润滑油液位精准监测系统

精准监测系统模板匹配算法液位润滑油液面润滑油容器

一种基于问题属性的城市治理多模态大模型的构建方法

大语言模型多模态嵌入特征文本视觉特征提取

用于识别针对大语言模型的提示注入攻击的方法、模型及设备

站点导航

APP 下载