摘要
本发明公开了一种融合实体多维特征的基于无监督学习的实体对齐方法,所述方法包括:从实体中信息源中提取多维特征表示实体;对数据进行特征抽取,考虑模态异质性,分别得到不同模态下的嵌入结果;将多模态知识图谱的结构嵌入、视觉嵌入、实体词级与字符级嵌入、属性字符嵌入进行联合,并将多模态嵌入加权连接,集成为联合嵌入;基于联合嵌入结果,计算跨图实体之间的相似度并生成初始对齐种子;使用结构增强迭代策略对初始对齐种子进行降噪,迭代提取新的高质量实体对。本发明能有效提高初始训练与迭代训练的对齐种子的质量,从而有效提升多模态知识图谱融合时实体对齐的效率和准确率。
技术关键词
实体对齐方法
无监督学习
字符
视觉特征
文本挖掘方法
种子
训练注意力
递归神经网络
矩阵
图谱
三元组
多模态
列表
图像
策略