摘要
本发明属于计算机科学与网络安全交叉技术领域,具体涉及一种用于整合碎片化网络安全信息的知识图谱构建方法,解决现有技术难以处理重叠实体、非连续实体的问题及知识图谱实体冗余的问题。包括如下步骤:1)收集大量开源安全数据作为原始数据;2)构建网络安全本体模型;3)对原始数据进行预处理得到初始数据,并人工标注数据构造训练集;4)训练命名实体识别模型并使用该模型和网络安全本体模型对初始化数据进行安全实体识别和关系提取,并利用图数据库构建安全知识图谱;5)实现基于多特征相似度的重复实体筛选以解决知识图谱的冗余问题;6)定期重复执行步骤1),步骤3)和步骤5)以更新安全知识图谱。
技术关键词
知识图谱构建方法
网络安全信息
网络安全实体
attention机制
网络安全交叉技术
关系
知识图谱嵌入方法
缩减方法
预训练模型
命名实体识别模型
三元组
网络安全数据
更新知识图谱
网络安全威胁
语义
训练集