摘要
本发明公开了面向PDF文档的公式结构化解析与语义理解方法及系统,涉及文档智能化处理技术领域,包括以下步骤:对预先获取的PDF文档进行依次进行渲染、归一化及倾斜校正处理,得到预处理后的文档图像;基于上下文信息融合机制,并结合预设的公式区域检测模型,对预处理后的文档图像进行检测,得到公式图像;基于注意力机制,并利用预设的公式解析模型,对公式图像进行结构化解析,得到公式二维结构信息。本发明采用深度学习模型进行公式检测和解析,具有高精度和高鲁棒性,实现了公式的结构化,提高了信息利用效率,并降低了人工成本。
技术关键词
语义理解方法
信息融合机制
公式解析
图像块特征
霍夫变换算法
语义理解系统
坐标转换算法
协方差矩阵
交叉注意力机制
校正
解码器
边缘检测算法
大津算法
坐标点
深度学习模型
编码
轮廓边缘
系统为您推荐了相关专利信息
动态区域划分
覆盖优化方法
概率假设密度滤波器
地图
规划
多尺度图像块特征
图像处理方法
图像特征向量
层级
图像重建
语义理解系统
嵌入特征
视频特征提取
文本
子模块
桥梁病害检测
大语言模型
识别方法
图像编码器
图像块特征