摘要
本发明提供一种基于深度学习的工程图纸钢筋大样注释文本检测方法、系统、设备及存储介质,方法包括如下步骤:S1、工程图纸图像预处理及钢筋大样注释文本区域数据集标注;S2、构建分阶段多尺度特征图提取骨干网络构架;S3、在各尺度特征图中引入压缩激励;S4、非线性建模上采用ACON自适应激活函数;S5、构建基于RSE‑FPN的多尺度特征金字塔结构并叠加尺度强化融合;S6、输出近似二值图实现边界框的精确预测。本发明显著提升OCR检测精度,有效克服小字符与复杂背景干扰,减少漏检误检;模型轻量化便于设备高效部署;输出边界紧致精准、语义合理,利于后续识别与解析;具备优异泛化能力,适配不同格式、清晰度与风格的钢筋大样图纸,工程实用性强。
技术关键词
文本检测方法
工程图纸
钢筋
Sigmoid函数
非易失性存储介质
轻量卷积神经网络
多尺度特征
非线性
分支
特征金字塔网络
全局平均池化
二值化阈值
预定义阈值
金字塔结构
通信接口
图像
存储器