摘要
本申请提供了一种PDF论文解析方法、电子设备和存储介质,其中,该方法包括:对待解析PDF论文进行版面分析,得到待解析PDF论文中的多个目标内容区域,对多个目标内容区域进行排序,得到多个目标内容区域的位置排序,位置排序用于指示多个目标内容区域在待解析PDF论文中的前后位置关系,分别对多个目标内容区域进行文本识别,得到多个目标内容区域的区域文本内容,根据位置排序,对多个目标内容区域的区域文本内容进行排列,得到待解析PDF论文的目标解析文本。采用本方案对PDF论文解析,保证了PDF论文的完整性和上下文衔接的准确性。
技术关键词
论文
解析方法
机器可读指令
排序模型
文本识别模型
电子设备
标签
处理器
可读存储介质
存储器
图片
计算机
图表
关系
系统为您推荐了相关专利信息
扩展文件系统
高性能
认证令牌
机器学习模型
接口
预训练语言模型
机电产品设计
预训练模型
文本
参数识别模型
原始查询语句
查询意图
生成方法
多模态信息融合
人机交互界面
大语言模型
机器可读指令
数据
处理器
可读存储介质