摘要
本发明涉及知识图谱技术领域,具体为一种知识图谱优化方法及系统,均能够:提取目标知识图谱中各实体;对提取的各实体两两组合得到若干个第一实体对;过滤掉不满足过滤条件的第一实体对,得到过滤后的第一实体对;计算每一个过滤后的第一实体对内两实体的编辑距离;选取编辑距离满足预设阈值条件的过滤后的第一实体对,作为第二实体对;计算第二实体对中两实体之间的相似度,选取目标实体对;计算各目标实体对中各实体的BM25分值;对每一个目标实体对,基于计算的实体对中各实体的BM25分值,实现目标知识图谱中该实体对中实体的统一。本发明主要用于降低图谱的稀疏性和冗余度。
技术关键词
知识图谱优化方法
BERT模型
GCN模型
编辑
节点
文本
训练集
更新模型参数
标签
知识图谱技术
关系
标识实体
大津算法
矩阵
分词
组合模块
过滤模块
系统为您推荐了相关专利信息
数据溯源方法
节点
异常数据
路径特征
数据溯源系统
通讯设备
风险预警方法
多源异构数据
分布式计算节点
风险预警装置
邻域
特征提取方法
平衡二叉树
特征提取算法
决策