摘要
本发明公开了一种基于多视图特征融合的二次图纸检索与定位方法及系统,属于图像语义检索技术领域,包括:对输入的二次图纸进行标注,生成二值掩码图像;采用EPNet模型进行特征提取;对提取的多尺度特征图进行融合;构建监督学习模型;利用训练完成的模型对输入图纸进行检测,输出检测结果,通过人工审核修正,将修正数据加入训练数据集进行再训练,更新模型参数。本发明可以有效提升工程图纸标注的效率,减少人工误差,为工程设计、数字化建模和自动化标注提供高效解决方案。该发明通过渐进式尺度算法实现密集单元格的识别,自适应注意力权重分配增强了模型对样本的利用率和识别精度,同时提升了对输入变化和干扰的鲁棒性。
技术关键词
定位方法
图纸
监督学习模型
二值掩码图像
更新模型参数
全局平均池化
特征金字塔网络
上采样方法
融合特征
语义检索技术
切片
扩展模块
注意力机制
像素
输入多尺度
优化器
模型训练模块
通道