摘要
本发明涉及计算机技术领域,提供一种版面分析方法及装置,所述方法包括:提取待分析文档的图像特征以及版面分析提示文本的文本特征;利用图像特征以及文本特征,生成包含文档内各要素的文本内容及要素间逻辑顺序的结构化序列;提取结构化序列生成过程中与各要素对应的特征表示;基于各要素的特征表示,对各要素进行目标检测,得到各要素的坐标位置。本发明通过将版面分析任务解耦为“逻辑顺序与内容解析”和“并行化要素定位”两个阶段,提升了整个版面分析流程的推理效率,有效解决了传统方法中效率与精度难以兼顾的技术难题。
技术关键词
版面分析方法
文本
查询特征
序列
非暂态计算机可读存储介质
逻辑
标记
图像块
编码向量
处理器
坐标
多模态
分词
多层感知机
计算机程序产品
排版
解析单元
分析装置
定位单元
系统为您推荐了相关专利信息
X射线三维成像
缺陷定量表征
选矿机
多智能体强化学习
数据
自动配料方法
模糊逻辑控制
置信度阈值
时序
强化学习算法