摘要
本发明公开了一种基于多模态信息抽取的工程图纸图签识别方法及系统,所述方法包括,获取工程图纸图像并对图像进行预处理,设定控制抽取目标和关系模式的数据结构Schema;通过训练好的图签检测模型检测图纸中的图签区域,得到每个图签的边界框坐标,将检测到的边界框坐标映射回原始图像的坐标系,并从原始图像中裁剪出对应的图签图像;对裁剪出的图签图像进行文本识别,提取出文本内容及对应的文本框坐标信息;将裁剪出的图签图像与文本识别结果输入至训练好的多模态信息抽取模型,并根据设定的Schema进行信息抽取,输出结构化的抽取结果。该方法可灵活定义抽取目标,支持二元组和三元组的统一抽取,抽取准确性高。
技术关键词
图签识别方法
多模态信息
工程图纸
文本识别
信息抽取模型
三元组
引导器
前馈神经网络
注意力机制
坐标系
模式
模型超参数
后处理模块
图像块
布局
系统为您推荐了相关专利信息
图像处理方法
数据存储单元
图像分类模型
计算机程序产品
文本识别
行星滚柱丝杠
自动生成方法
人机交互界面
控件
零件