摘要
本发明公开了一种文档语义DOM网络构建方法及系统,属于文档处理和自然语言处理技术领域,PDF文档语义DOM网络构建方法通过计算机执行以下步骤:利用大语言模型对从PDF文档中提取的信息单元进行语义角色和功能类型分析,生成语义节点;结合版面特征与语义内容构建初步的层级树状结构,并采用优化算法调整该树;基于大语言模型的判断及预设的加权公式计算关系置信度,从而建立跨越层级的语义链接,最终形成一个语义DOM网络,输出的语义网络能够揭示文档深层的论证逻辑,支持高级语义查询,为下游的知识图谱构建和智能问答系统提供了高质量的结构化数据基础。
技术关键词
网络构建方法
大语言模型
语义角色
节点
网络构建系统
关系
层级
语义层面
逻辑
智能问答系统
距离信息
知识图谱构建
定义
分析模块
概念
布局
树状结构
自然语言
系统为您推荐了相关专利信息
接触网
路径规划方法
机械臂运动路径
检修车
螺栓
滑动时间窗口
筛选方法
神经网络模型
轨道
结构构建方法