摘要
本申请涉及自然语言处理技术领域,公开一种窃取攻击行为检测方法、装置、设备及存储介质。该方法包括:获取用户与大语言模型之间的历史对话数据;对对话内容数据进行主题相关性似然估计,得到表征对话内容数据之间的主题相关强度的主题似然估计结果;对对话内容数据进行逻辑连续性似然估计,得到表征对话内容数据之间的逻辑连续强度的逻辑似然估计结果;对主题似然估计结果和逻辑似然估计结果进行联合估计,得到表征对话内容数据之间的主题相关强度和逻辑连续强度的联合估计结果;对联合估计结果进行分析,以检测窃取攻击行为。本申请实施例可以根据对话内容的主题和逻辑检测窃取攻击行为,增强大语言模型安全性。
技术关键词
主题
逻辑
大语言模型
数据
强度
连续性
多轮对话
滑动窗口方法
可读存储介质
电子设备
自然语言
处理器
模块
存储器
计算机
系统为您推荐了相关专利信息
水下推进器
故障诊断方法
速度预测模型
故障分类模型
故障特征
重建点云
解码器
三维缺陷检测方法
训练集
噪声方差
多维数据分析方法
核电设备
多信号
数据分析模块
学习方法
品质预测方法
随机森林模型
样本
更新模型参数
记忆单元