摘要
本发明提供了一种基于APT知识图谱嵌入的检索增强生成方法,适用于网络安全领域中高级持续性威胁(APT)的归因溯源领域。本发明基于APT组织开源情报知识构建领域知识图谱。并依据图谱关系训练知识图谱嵌入模型,将节点由高维的语义特征映射到空间向量特征。为进一步分析节点向量的分布特性,采用DBSCAN算法对图谱聚类分析,引入大语言模型进行特征归纳。针对节点描述信息,使用预训练模型生成文本嵌入。最终使用联合嵌入优化策略,识别查询节点并结合节点图谱信息,聚类归并信息,相似描述信息,相似节点图谱信息动态检索。本发明为知识图谱结构信息与文本非结构信息融合检索生成提供了新的解决方案,提升了专有领域问答效率与多模态信息交互的可行性。
技术关键词
实体
三元组
生成方法
预训练语言模型
大语言模型
知识图谱查询
节点
语义特征
关系
预训练模型
DBSCAN算法
聚类
构建知识图谱
组织
模块
文本
策略
生成用户