基于图像识别的PDF文档结构化加载方法

AITNT
正文
推荐专利
基于图像识别的PDF文档结构化加载方法
申请号:CN202510608694
申请日期:2025-05-13
公开号:CN120181041B
公开日期:2025-09-05
类型:发明专利
摘要
本申请提供了基于图像识别的PDF文档结构化加载方法,涉及图像数据处理技术领域,包括:基于PDF文档的边距信息设置文档图像的预定提取尺度;以预定提取尺度中的预定粗尺度获取PDF文档的初始图像;引入预处理策略对初始图像进行处理,得到目标图像;多维收集目标图像的目标特征参数集,并激活加载引擎分类器对目标特征参数集进行分析,确定目标引擎类别;通过目标引擎类别对初始图像进行结构化加载。本申请解决了现有技术由于无法根据PDF文档中图像的语义特征和布局形式自适应选择加载引擎,导致图像型PDF结构还原效果差的技术问题,达到了提升复杂PDF文档结构重建准确性与数据加载质量的技术效果。
技术关键词
分类器 特征值 图像数据处理技术 支持向量机 颜色 图片 分层 策略 离散余弦 布局形式 纹理特征 语义特征 邻域 标识 表格 参数 文本
系统为您推荐了相关专利信息
1
一种基于实时多任务融合算法的自然生长苹果三维姿态识别方法
三维姿态识别方法 融合算法 多任务深度学习 相机图像传感器 图像像素
2
一种融合多维特征的图像情感分析方法
图像情感分析方法 恐惧情感 融合深度学习模型 负面情绪检测 融合多维特征
3
一种听觉方位注意解码方法及装置
解码模型 听觉 特征提取器 脑电信号处理 解码方法
4
一种用于智能电表的数据特征分析方法及系统
数据特征分析方法 日用电量 特征值 曲线 时间段
5
风电功率预测方法、装置、设备及存储介质
风电功率预测模型 风电功率预测方法 风电功率预测装置 数值天气预报数据 样本
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号