摘要
本发明公开了一种复杂大型图纸表格提取重建方法及系统,系统包括:边缘提取单元,用于对输入的大型图纸文件进行边缘提取,得到表格图片;表格结构识别单元,用于利用形态学操作模块和联通区域标记模块对提取的表格图片进行结构识别以得到单个表格图片;裁剪与识别单元,用于通过行列线交叉点检测模块识别单个表格图片的行列线并结合单元格位置识别模块定义单元格区域,最后使用单元格裁剪模块对单元格区域进行裁剪并通过PaddleOCR文本识别模块进行文字识别;表格还原重建单元,用于对单元格区域的坐标进行重排序与合并操作,并结合识别得到的文字完成表格还原。本发明提高了复杂大型图纸表格的识别与还原准确度,具有一定的先进性。
技术关键词
表格
重建系统
图片
语义分割模型
裁剪模块
图纸
位置识别
坐标
文本识别
交叉点
标记
代表
重构模块
邻域
覆盖率
像素
注意力
长宽比
识别模块