一种文档中表格的识别方法

AITNT
正文
推荐专利
一种文档中表格的识别方法
申请号:CN202510498402
申请日期:2025-04-21
公开号:CN120014662B
公开日期:2025-06-20
类型:发明专利
摘要
本发明公开了一种文档中表格的识别方法,涉及表格识别技术领域,通过利用相似性传递性假设,该方法通过计算相邻表格之间的相似度,能够高效地判断不同表格区域是否存在跨页行为。通过设定相似度阈值,该方法能够自动识别相邻表格是否属于同一组表格,从而判断是否存在跨页表格,通过遍历完整表格内的所有单元格,并判断每个单元格是否属于合并单元格的一部分,本发明能够准确区分出空白合并单元格和真正的空白单元格,这一过程使得合并单元格的判定更加细致和准确,避免了传统方法中由于误判合并单元格而导致的数据解析错误。
技术关键词
合并单元格 识别方法 边缘检测 生成表格数据 表格识别技术 像素点 Otsu算法 文本 图像 类间方差 索引 坐标 强度 字体 编辑 变量
系统为您推荐了相关专利信息
1
一种印刷机料带离平面振动传输张力识别方法
印刷机 共振频率 结构振动响应 识别方法 数据结构模型
2
一种自动控制双辊薄带连铸生产过程中的熔池高度的方法
双辊薄带连铸 激光测距模块 激光测距数据 深度学习算法 结晶辊
3
一种弹簧抛丸方法
弹簧抛丸 传送机构 传送结构 高速电机驱动 抛丸机
4
基于磁吸传感与视觉识别技术的蓝莓智能筛选装置
视觉识别方法 树莓派作 视觉监测系统 磁性相互吸引 视觉识别技术
5
一种基于OCT图像的视网膜分层线识别方法
线识别方法 分层 加权有向图 视盘 玻璃体
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号