面向PDF文档的公式结构化解析与语义理解方法及系统

AITNT
正文
推荐专利
面向PDF文档的公式结构化解析与语义理解方法及系统
申请号:CN202511358351
申请日期:2025-09-23
公开号:CN120877069A
公开日期:2025-10-31
类型:发明专利
摘要
本发明公开了面向PDF文档的公式结构化解析与语义理解方法及系统,涉及文档智能化处理技术领域,包括以下步骤:对预先获取的PDF文档进行依次进行渲染、归一化及倾斜校正处理,得到预处理后的文档图像;基于上下文信息融合机制,并结合预设的公式区域检测模型,对预处理后的文档图像进行检测,得到公式图像;基于注意力机制,并利用预设的公式解析模型,对公式图像进行结构化解析,得到公式二维结构信息。本发明采用深度学习模型进行公式检测和解析,具有高精度和高鲁棒性,实现了公式的结构化,提高了信息利用效率,并降低了人工成本。
技术关键词
语义理解方法 信息融合机制 公式解析 图像块特征 霍夫变换算法 语义理解系统 坐标转换算法 协方差矩阵 交叉注意力机制 校正 解码器 边缘检测算法 大津算法 坐标点 深度学习模型 编码 轮廓边缘
系统为您推荐了相关专利信息
1
一种基于改进劳埃德算法的多无人机协同搜索与覆盖优化方法
动态区域划分 覆盖优化方法 概率假设密度滤波器 地图 规划
2
图像处理方法、装置、电子设备及存储介质
多尺度图像块特征 图像处理方法 图像特征向量 层级 图像重建
3
一种基于语法树和语义分析的作业智能批改方法
作业智能 公式解析 语义向量 文本 教育专用
4
一种唇语识别及语义理解系统和方法
语义理解系统 嵌入特征 视频特征提取 文本 子模块
5
一种基于大语言模型的钢桥梁病害检测识别方法
桥梁病害检测 大语言模型 识别方法 图像编码器 图像块特征
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号