摘要
本发明公开了一种基于稀疏缩放网络和多重超图的知识图谱构建方法,属于信息抽取技术领域。包括:首先,对语料库中的文本进行预处理;其次,对文本中可能存在的实体进行边界识别,生成实体的边界候选标记;接着,对每个词或字符进行标注,从前向/后向/左向/右向四个方向上生成多重的局部超图表示;然后,对多重的局部超图进行解码,识别嵌套命名实体;最后,使用基于多层感知机的模型来学习从实体语法特征到实体对关系类型的映射。本发明通过基于稀疏缩放网络的冗余信息处理,能够减少冗余信息,更加精确地捕获文本中的关键语义特征;通过基于多重超图的嵌套命名实体识别方法,提高了知识图谱构建的性能。
技术关键词
知识图谱构建方法
实体
结点
序列
语法特征
标签
分词
文本
生成结构化数据
多层感知机
网络
标记
字符
生成规则
信息抽取技术
语义特征
深度优先搜索
解码
系统为您推荐了相关专利信息
巡检机器人
缺陷检测系统
机器人巡检
图像获取模块
视觉缺陷检测
智能调控系统
数据处理单元
数据采集单元
区域控制单元
高低压
循环加热系统
模型预测控制框架
反馈控制模块
热传导方程
优化约束条件