摘要
本发明公开了一种基于图元识别的非结构化文件识别方法,包括以下步骤:(1)预处理,用于将电气接线图纸裁剪、缩放至所需尺寸并进行灰度处理;(2)图元识别,采用融合注意力机制的YOLO电气图元检测算法构建电气图元检测模型的特征提取网络;(3)文字识别,包括以下步骤:剔除图元、标注文本区域检测、文本候选框构造、标注文本分割与边界调整、标注文本内容识别、电气文本识别结果过滤;(4)电气元素关联关系分析,包括以下步骤:框架元素提取,图元组区域划分、模板匹配以及电气图元‑标注文本关联。本发明能够获取电气接线图的图元及文字,且能够解决标注文字出现不同字体和样式的问题,理解语义信息。
技术关键词
文件识别方法
图元
文本区域检测
融合注意力机制
文本识别
关联关系分析
特征提取网络
多任务损失函数
线构造
元素
通道注意力机制
电气接线图
图纸
模板
清洗算法
重叠阈值
框架
系统为您推荐了相关专利信息
文本识别方法
字符
语义
文本识别装置
数据识别技术
图像超分辨率方法
多层次特征
记忆
网络
融合语义信息
识别语音信号
语音识别方法
大语言模型
文本识别
计算机可执行指令