摘要
本发明公开了一种基于节点切和多次划分的大规模多语言知识图谱对齐方法,包括,1)获取中文英文知识图谱和英文中文知识图谱;2)利用预训练模型得到实体的语义向量表示;3)构建基于节点切分的结构相似的子图对;4)利用基于结构的嵌入模型得到实体的结构向量表示;5)融合语义向量表示和结构向量表示得到融合相似度;6)利用实体对齐评价指标检验大规模多语言知识图谱之间的对齐程度。本发明能提高子图的潜在映射率,从而能提高知识图谱融合的可扩展性、准确性和鲁棒性,为搜索引擎与问答系统,推荐系统与个性化服务等领域的共享机制提供有力支撑。
技术关键词
对齐方法
多语言
实体
节点
中文知识图谱
三元组
语义向量
键值
预训练语言模型
定义
融合语义
可读存储介质
样本
预训练模型
问答系统
处理器
推荐系统
关系