摘要
本发明公开了一种基于命名实体识别和关系抽取的知识图谱构建方法,本发明采集电力领域语料,从语料中分割出句子,并对句子进行预处理;构建电力设备本体体系,包括类、属性和实例;收集实体识别训练集并将实体识别训练集输入双向长短期记忆网络进行训练,获得可用于实体识别的命名实体识别模型;获取输入句子的分词结果以及句法依赖树,在句法依赖树上构建图结构,将其放入擅长处理拓扑结构的GCN模型中,根据学习的权重矩阵预测关系,形成设备关联抽取模型;构建知识图谱。本发明无需人工过多参与,而且语料处理的速率远高于人工,进而可以使得可以在一定周期内识别更多的电力领域语料,进而使得最终构造的知识图谱更加完善。
技术关键词
知识图谱构建方法
命名实体识别模型
双向长短期记忆网络
关系
电力设备
构建知识图谱
分词
可读存储介质
词典
词语
矩阵
训练集
文本
注意力
序列特征
模块
计算机
系统为您推荐了相关专利信息
计算方法
地质勘探数据
储层参数
饱和度
三维地质模型
管理优化方法
多生理参数采集
皮尔逊相关系数
个性化阈值
血流动力学管理
卷积模块
桥梁病害识别方法
无监督学习
深度学习网络
输入模块