摘要
本发明涉及工程图纸识别及OCR方法、文本识别模型及电子设备。工程图纸识别方法包括步骤:图纸划分步骤,检测工程图纸的信息,并将工程图纸划分为图框区域及视图区域;以及文本信息识别步骤,分别识别图框区域及视图区域的文本信息;其中,识别视图区域的文本信息包括:训练识别视图区域文本信息的文本识别模型。本发明基于工程图纸文本信息的复杂及特殊性,将图纸划分为图框区域和视图区域,并针对性地通过计算机视觉与自然语言处理,训练识别视图区域文本信息的文本识别模型,并分别识别并提取得到各区域的文本信息,实现了自动化提取图纸信息,同时提高了工程图纸信息识别及提取的速度及准确性,进而提高了基于图纸对客户报价的速度。
技术关键词
工程图纸识别方法
文本识别模型
命名实体识别模型
图框
关键词
文本信息提取
过滤法
词典
电子设备
计算机视觉
自然语言
算法
矩形
速度
客户
系统为您推荐了相关专利信息
OCR识别模型
光学字符识别
生成规则
语义关键词
因子
智能纠错方法
文本
seq2seq模型
关键词
NoSQL数据库
图像特征向量
文本识别方法
文本识别模型
注意力
图像特征提取