一种解析pdf中段落对齐方法、装置及介质

AITNT
正文
推荐专利
一种解析pdf中段落对齐方法、装置及介质
申请号:CN202411569235
申请日期:2024-11-05
公开号:CN119227671A
公开日期:2024-12-31
类型:发明专利
摘要
本发明属于PDF解析技术领域,提供了一种解析pdf中段落对齐方法、装置及介质。本发明利用Apache的开源框架PDFBOX,对PDF文件进行读取,然后对文字进行排序、转换排版,确定好段落,标题,页眉页脚等信息,基于段落内容进行行级拆分,并设置容错空间对行级内容进行分析判断,由此确定段落对齐,从而能够保持转换后的文档的准确对齐,并具有高质量、易编辑的特点。
技术关键词
对齐方法 坐标 开源框架 对齐装置 Y轴 页面宽度 排版 解析技术 存储计算机程序 数据 存储器 排序算法 处理器 可读存储介质 列表 字体 编辑 内存
系统为您推荐了相关专利信息
1
一种三极管及其封装方法
封装部件 三极管 关系 封装方法 形态
2
基于图像数据互馈式地质灾害探测系统以及方法
地质灾害探测系统 纹理 山坡地形 数据 三维模型
3
巡检点位的标定方法、装置、设备、机器人、介质及程序
机器人巡检 三维模型 巡检路径 标定方法 云台
4
一种目标定位方法及装置
图像处理 末端执行器 标定关系 节点 链表
5
一种模型堆叠方法、装置、电子设备及存储介质
物体 尺寸 容器 堆叠方法 信息更新
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号