摘要
本申请涉及一种无线表格结构识别方法、装置、设备、存储介质和程序产品,涉及图像识别技术领域。其中,从目标表格图像中提取至少一个内容轮廓;对每个内容轮廓进行噪声去除处理,得到至少一个内容区域;基于每个内容区域的中心点进行聚类处理,确定多个单元格块;对多个单元格块进行水平投影,根据水平投影结果确定行坐标信息;对多个单元格块进行垂直投影,根据垂直投影结果确定列坐标信息;根据行坐标信息和列坐标信息确定表格结构。采用本方法能够减少噪声干扰,提升无线表格结构识别的准确性,对单元格内多个内容区域进行聚类处理,能够精准地获取表格单元格区域,无需利用深度学习算法,耗费资源少,能够简洁有效地识别无线表格结构。
技术关键词
表格
结构识别方法
坐标
噪声
矩形
轮廓面积
轮廓尺寸
聚类
识别装置
图像识别技术
深度学习算法
计算机程序产品
轮廓提取
投影模块
处理器
数值
计算机设备