摘要
本发明公开了一种文档中表格的识别方法,涉及表格识别技术领域,通过利用相似性传递性假设,该方法通过计算相邻表格之间的相似度,能够高效地判断不同表格区域是否存在跨页行为。通过设定相似度阈值,该方法能够自动识别相邻表格是否属于同一组表格,从而判断是否存在跨页表格,通过遍历完整表格内的所有单元格,并判断每个单元格是否属于合并单元格的一部分,本发明能够准确区分出空白合并单元格和真正的空白单元格,这一过程使得合并单元格的判定更加细致和准确,避免了传统方法中由于误判合并单元格而导致的数据解析错误。
技术关键词
合并单元格
识别方法
边缘检测
生成表格数据
表格识别技术
像素点
Otsu算法
文本
图像
类间方差
索引
坐标
强度
字体
编辑
变量
系统为您推荐了相关专利信息
印刷机
共振频率
结构振动响应
识别方法
数据结构模型
双辊薄带连铸
激光测距模块
激光测距数据
深度学习算法
结晶辊
弹簧抛丸
传送机构
传送结构
高速电机驱动
抛丸机
视觉识别方法
树莓派作
视觉监测系统
磁性相互吸引
视觉识别技术