摘要
本发明提供一种行业对公信贷子图的提取方法及相关设备,获取全量知识图谱,对全量知识图谱分别进行元路径压缩、语义压缩、补充相近实体和边赋权与压缩,最终压缩得到了一个较为有效的且规模较小的行业对公信贷子图。在本方案中,使用元路径压缩不但保留了预定的语义信息,还通过特征转移将删除的实体信息转移到被保留的实体上,降低规模但信息损失较少,通过语义压缩从行业角度保留相关实体,并通过随机游走来选择相关度较高的实体,在边赋权与压缩中删除较为久远的边,降低子图的复杂性,以实现提高压缩速度并保留足够多实体特征的目的。
技术关键词
实体
图谱
压缩单元
行业特征
白名单
融合特征
存储计算机程序
列表
语义
存储器
处理器
电子设备
频率
规模
关系
速度