摘要
本发明涉及文档理解技术领域,公开了基于知识图谱的文档理解方法、装置、设备及存储介质,该方法包括:获取待查询目标对应的目标文档,并对目标文档进行解析得到目标文档中包含的文档元素和业务元素;提取文档元素与业务元素间的关联关系;以文档元素和业务元素为节点,并以关联关系为边构建目标文档的目标知识图谱;基于待查询目标在目标知识图谱中进行搜索,得到候选节点,并确定候选节点在目标文档中对应的基础文档元素;将候选节点和候选节点在目标文档中对应的基础文档元素作为补充知识与待查询目标、目标文档共同输入预设文档理解模型,确定待查询目标的文档理解结果。本发明提高了目标数据的召回效果和文档理解结果的准确性。
技术关键词
元素
文本
表格
图谱
实体
节点
关系
排版方式
计算机
语义特征提取
关键词
基础
理解技术
主题数据
可读存储介质
存储器
语句
处理器
指令
系统为您推荐了相关专利信息
智能推荐系统
知识图谱构建
编码器
构建知识图谱
矩阵
电化学储能电池
大语言模型
预警方法
实体
时序特征