摘要
本发明涉及一种图纸结构化识别方法与终端,对目标图纸基于图纸尺寸进行动态滑动窗口的图像分割,得到若干个窗口图像;将每个所述窗口图像输入EfficientViT网络,由所述EfficientViT网络结合边缘增强机制进行多尺度特征提取和融合,生成融合特征图;对所述融合特征图进行超像素级特征的生成,并结合所述超像素级特征,通过Transformer解码器进行实例查询与语义查询,生成包括实例级二值掩膜和语义类别掩膜的识别结果;本发明通过动态滑动窗口适配不同尺寸图纸,解决分割不完整问题;EfficientViT结合边缘增强机制提取多尺度特征,提升非标准图元识别率;超像素聚合与Transformer解码生成双掩膜,实现跨模态对齐,且满足大规模图纸实时性需求。
技术关键词
结构化识别方法
动态滑动窗口
图纸
融合特征
多尺度特征提取
语义
像素
掩膜
图像分割
尺寸特征
解码器
卷积模块
机制
小尺寸
识别终端
注意力
网络
系统为您推荐了相关专利信息
人工神经网络模型
卷积神经网络模型
多模态深度学习
报告生成方法
梯度下降算法
识别方法
宫颈癌识别
斜坡信号
信号系统
神经网络算法
心理状态识别
康复训练方法
人工智能系统
识别患者
特征提取模块