摘要
本发明公开了一种工程图纸表格识别与设备数据自动校核方法,通过表格目标识别确定工程图纸中的表格位置;解析表格结构以明确各单元格的位置关系;利用RapidOCR进行文字识别,将提取的文本与单元格对应形成结构化表格数据;基于改进布谷鸟的语义相似度算法,对解析出的表格内容的总材料清册与分材料清册的数据进行匹配和一致性验证,最终输出核对结果。本发明针对表格结构识别采用分治法对大尺寸表格进行切割处理后再合并,有效提高了表格结构识别的准确率;同时,结合余弦相似度和词向量语义相似度的方法评价设备名称的相似性,增强了布谷鸟算法的局部搜索能力和跳出局部最优的能力,从而提升了设备名称匹配的准确率。
技术关键词
自动校核方法
工程图纸
表格
布谷鸟算法
综合评分方法
数据
语义
切割算法
评价设备
坐标
编码器
文本
图片
因子
图像
关系
码头
决策
变量
系统为您推荐了相关专利信息
合金
命名实体识别
信息获取方法
机器学习模型
文本挖掘方法
视觉特征
深度强化学习模型
注意力机制
集成向量
关键帧
基因遗传工程
文件特征
自动生成方法
APK重打包
子模块