摘要
本发明公开了一种文本抽取与图谱嵌入融合的知识图谱更新方法及系统,涉及自然语言处理技术领域,包括:获取现有知识图谱及待处理文本;基于现有知识图谱获取初始实体对的嵌入特征向量;基于待处理文本获取全句特征向量和每个子词对应的隐藏向量;基于隐藏向量和全句特征向量得到文本实体对对应的文本特征向量;基于嵌入特征向量和文本特征向量获取融合关系预测概率;基于隐藏向量获取实体识别概率;基于文本特征向量获取文本关系预测概率;基于上述三个概率筛选得到待处理文本中的高置信度三元组并加入现有知识图谱得到更新知识图谱;基于高置信度三元组和新增实体进行增量更新得到更新知识图谱嵌入特征向量。实现了循环优化的动态知识图谱构建。
技术关键词
知识图谱更新方法
文本特征向量
实体
更新知识图谱
三元组
增量更新
关系
适配器
嵌入特征
数据获取模块
动态知识图谱
广度优先搜索
短距离
更新系统
矩阵
邻居
自然语言