摘要
一种基于word文档的知识图谱生成方法、装置及电子设备,涉及数据处理领域。在该方法中,对目标文档进行解析,得到对应的xml文件;对xml文件进行解析,得到第一数据结构,第一数据结构包括多个元素;在第一数据结构中,对多个元素按照预设排序规则进行排序,得到第二数据结构;采用预设递归函数对第二数据结构进行切分,得到多个实体和多个实体之间的关系;将多个实体作为预设知识图谱的节点,并将多个实体之间的关系作为预设知识图谱的边,得到目标知识图谱。实施本申请提供的技术方案,通过将文档内容转换为XML格式进行识别提取,提高了文档转知识图谱的准确性。
技术关键词
知识图谱生成方法
实体
元素
功能系统
文本
语句
分词
关系
电子设备
网络接口
模块
可读存储介质
节点
指令
字符
对象
设备通信
存储器
生成装置
系统为您推荐了相关专利信息
查询控制方法
知识图谱构建
BIM模型数据
自然语言
语义