摘要
本发明公开了一种融合自监督学习和知识图谱的恶意指令检测方法及系统。方法包括:获取用户指令数据及合规标签,构建对抗样本生成矩阵,通过分层变异和合规修正生成对抗样本库;将原始指令和对抗样本输入多模态检测模型,模型含双通道编码器和动态知识图谱模块;通过自监督对比损失函数优化模型,正样本需满足语义和攻击特征相似度阈值要求,负样本为违规指令;将待检测指令输入训练后的模型,提取特征并与知识图谱进行多跳推理,计算风险评分;检测到恶意指令时,生成处置策略并更新知识图谱节点。通过融合自监督学习和动态知识图谱,实现了准确检测,增强了模型泛化能力和鲁棒性,提高了检测精度。
技术关键词
动态知识图谱
指令
更新知识图谱
样本
损失函数优化
在线更新方法
编码器
多模态
风险
节点
语义
剪枝策略
变异策略
分层
模式检测
模块
动态更新
标签