一种基于全景分割的报纸图像版面分析方法

AITNT
正文
推荐专利
一种基于全景分割的报纸图像版面分析方法
申请号:CN202510635580
申请日期:2025-05-16
公开号:CN120496105A
公开日期:2025-08-15
类型:发明专利
摘要
本发明公开了一种基于全景分割的报纸图像版面分析方法,通过构建解决复杂报纸图像版面分割与分类问题的通用模型Panoptic‑DLA,解决版面分析中存在的两个经典问题:前景像素漏检率高和相邻区域误合并问题。本发明适用于历史报纸的文档布局分析,其以报纸图像作为输入,输出得到各类元素及其位置。模型框架由语义分割分支和实例分割分支两个分支组成。语义分割将背景当作stuff,前景区域当作thing,预测像素类别。实例分割分支采用无提议设计,使用区域中心‑边界概率图和区域中心方向图代替传统的中心点回归方法,编码对象的形状和位置信息,分离报纸中紧密相邻的区域。后处理通过实例分组、语义类别分配及Regroup操作生成全景分割图,提升报纸图像版面分析的准确性。
技术关键词
版面分析方法 报纸 空间金字塔池化 语义 实例分割 图像 上采样 像素点 分支 解码模块 融合多尺度信息 推力 空洞 多尺度特征提取 生成高分辨率 输出特征 矩形 生成多尺度
系统为您推荐了相关专利信息
1
交互方法、装置、电子设备及存储介质
交互视频 语音 对象 语义 音频
2
基于上下文表示学习的城市区域动态表征学习方法
表征学习方法 特征提取器 信息更新 代表 动态更新
3
用于纤维水泥板制板的自动控制系统及方法
时序特征 纤维水泥板 自动控制方法 速度 编码向量
4
一种基于人工智能的教育资源个性化推荐方法及系统
教育资源个性化推荐方法 视频 关键词 教育资源个性化推荐系统 知识点
5
一种基于分割一切模型SAM的遥感图像鲁棒篡改定位方法
编码器 篡改定位方法 多尺度特征 层级 分支
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号