基于行业大模型的提示词攻击行为的检测方法、装置、设备及介质

正文

推荐专利

申请号：CN202510437284

申请日期：2025-04-09

公开号：CN119939578A

公开日期：2025-05-06

类型：发明专利

摘要

本申请公开了基于行业大模型的提示词攻击行为的检测方法、装置、设备及介质，涉及计算机技术领域，包括：基于预设正则表达式匹配库及客户端的提问信息对预设白名单进行多模正则匹配；若匹配失败则基于预设正则表达式匹配库及提问信息对预设黑名单进行多模正则匹配；若匹配失败，则利用预先基于目标语料训练集进行大模型微调后确定的拒识大模型对提问信息进行针对提示词攻击行为的检测；若检测结果表明提问信息为正常信息，则基于行业大模型确定提问信息对应的答复内容，利用预先基于所述目标语料训练集进行大模型微调后确定的拒答大模型对所述答复内容进行检测，以确定是否触发答复拦截操作。本申请提高了行业大模型对提示词攻击行为的防御能力。

技术关键词

白名单训练集条目客户端匹配模块列表日志日期端口可读存储介质服务端处理器电子设备数据语义存储器计算机风险

系统为您推荐了相关专利信息

基于MGWO优化Informer的超短期风电功率预测模型的建模方法

短期风电功率预测历史功率数据建模方法灰狼算法位置更新

一种人工智能的网络安全防护系统及方法

网络安全防护方法网络安全防护系统网络安全分析数据处理模块网络安全防护技术

一种基于深度神经网络的人像摄影图像仿色方法和系统

注意力深度神经网络风格图像特征编码全局特征提取

基于神经网络选择模型的交通事件主动处置决策方法及系统

决策方法交通神经网络模型构建数据训练集

一种数据交互处理方法和系统

数据交互方法编码三角形动态数学模型接收端

基于行业大模型的提示词攻击行为的检测方法、装置、设备及介质

站点导航

APP 下载