摘要
本发明公开了一种基于多模态信息抽取的工程图纸图签识别方法及系统,所述方法包括,获取工程图纸图像并对图像进行预处理,设定控制抽取目标和关系模式的数据结构Schema;通过训练好的图签检测模型检测图纸中的图签区域,得到每个图签的边界框坐标,将检测到的边界框坐标映射回原始图像的坐标系,并从原始图像中裁剪出对应的图签图像;对裁剪出的图签图像进行文本识别,提取出文本内容及对应的文本框坐标信息;将裁剪出的图签图像与文本识别结果输入至训练好的多模态信息抽取模型,并根据设定的Schema进行信息抽取,输出结构化的抽取结果。该方法可灵活定义抽取目标,支持二元组和三元组的统一抽取,抽取准确性高。
技术关键词
图签识别方法
多模态信息
工程图纸
文本识别
信息抽取模型
三元组
引导器
前馈神经网络
注意力机制
坐标系
模式
模型超参数
后处理模块
图像块
布局
系统为您推荐了相关专利信息
自动驾驶决策方法
多模态信息
信息编码
决策系统
动态更新
模态特征
跨模态
多模态信息
记忆系统
大语言模型
动态寻优控制方法
贴片工艺
三维网格模型
空间变换关系
迭代计算方法
训练数据获取方法
文本行
文本识别方法
矩阵
图像