摘要
本发明公开基于PDF文件的文本内容自适应插入方法、装置及相关介质,该方法包括对PDF文件的当前页面进行结构化解析,得到文本对象;对文本对象进行逻辑行与逻辑块的聚合,得到多个文本块;获取改写内容,将当前文本块的位置替换为改写内容,得到新文本块;判断新文本块与其他文本块是否相交;若相交则调整新文本块的字体比例或者进行版面重排;若不相交则判断新文本块是否超出当前页面的正文范围,将新文本块的超出部分插入至新页面,并结束流程。本发明对替换后的新文本块进行碰撞检测,调整相交的文本块,以及对超出页面的部分进行跨页处理,如此,PDF文件可以对插入的内容进行自适应调整,大大提高了编辑人员的工作效率。
技术关键词
文本
页面
逻辑
对象
碰撞检测算法
字体
字符
可调距离
可读存储介质
坐标误差
解析工具
处理器
内容流
排版
解析单元
数据
尺寸
计算机设备
关系
系统为您推荐了相关专利信息
结构三维模型
文本
材料性能参数
大语言模型
数据
土木工程混凝土
体积计量方法
三维模型
参数
土木工程建设技术
隔离结构
图像传感器
传感器阵列
电容器布置
有源像素传感器
运输车辆结构
时间序列特征
货车
关键词
上下文语义理解