摘要
本发明公开了一种基于全景分割的报纸图像版面分析方法,通过构建解决复杂报纸图像版面分割与分类问题的通用模型Panoptic‑DLA,解决版面分析中存在的两个经典问题:前景像素漏检率高和相邻区域误合并问题。本发明适用于历史报纸的文档布局分析,其以报纸图像作为输入,输出得到各类元素及其位置。模型框架由语义分割分支和实例分割分支两个分支组成。语义分割将背景当作stuff,前景区域当作thing,预测像素类别。实例分割分支采用无提议设计,使用区域中心‑边界概率图和区域中心方向图代替传统的中心点回归方法,编码对象的形状和位置信息,分离报纸中紧密相邻的区域。后处理通过实例分组、语义类别分配及Regroup操作生成全景分割图,提升报纸图像版面分析的准确性。
技术关键词
版面分析方法
报纸
空间金字塔池化
语义
实例分割
图像
上采样
像素点
分支
解码模块
融合多尺度信息
推力
空洞
多尺度特征提取
生成高分辨率
输出特征
矩形
生成多尺度
系统为您推荐了相关专利信息
表征学习方法
特征提取器
信息更新
代表
动态更新
时序特征
纤维水泥板
自动控制方法
速度
编码向量
教育资源个性化推荐方法
视频
关键词
教育资源个性化推荐系统
知识点