基于图像识别的PDF文档结构化加载方法

正文

推荐专利

基于图像识别的PDF文档结构化加载方法

申请号：CN202510608694

申请日期：2025-05-13

公开号：CN120181041B

公开日期：2025-09-05

类型：发明专利

摘要

本申请提供了基于图像识别的PDF文档结构化加载方法，涉及图像数据处理技术领域，包括：基于PDF文档的边距信息设置文档图像的预定提取尺度；以预定提取尺度中的预定粗尺度获取PDF文档的初始图像；引入预处理策略对初始图像进行处理，得到目标图像；多维收集目标图像的目标特征参数集，并激活加载引擎分类器对目标特征参数集进行分析，确定目标引擎类别；通过目标引擎类别对初始图像进行结构化加载。本申请解决了现有技术由于无法根据PDF文档中图像的语义特征和布局形式自适应选择加载引擎，导致图像型PDF结构还原效果差的技术问题，达到了提升复杂PDF文档结构重建准确性与数据加载质量的技术效果。

技术关键词

分类器特征值图像数据处理技术支持向量机颜色图片分层策略离散余弦布局形式纹理特征语义特征邻域标识表格参数文本

系统为您推荐了相关专利信息

一种基于实时多任务融合算法的自然生长苹果三维姿态识别方法

三维姿态识别方法融合算法多任务深度学习相机图像传感器图像像素

一种融合多维特征的图像情感分析方法

图像情感分析方法恐惧情感融合深度学习模型负面情绪检测融合多维特征

一种听觉方位注意解码方法及装置

解码模型听觉特征提取器脑电信号处理解码方法

一种用于智能电表的数据特征分析方法及系统

数据特征分析方法日用电量特征值曲线时间段

风电功率预测方法、装置、设备及存储介质

风电功率预测模型风电功率预测方法风电功率预测装置数值天气预报数据样本

基于图像识别的PDF文档结构化加载方法

站点导航

APP 下载