一种基于多模态信息抽取的工程图纸图签识别方法及系统

AITNT
正文
推荐专利
一种基于多模态信息抽取的工程图纸图签识别方法及系统
申请号:CN202510450366
申请日期:2025-04-11
公开号:CN119964171B
公开日期:2025-07-11
类型:发明专利
摘要
本发明公开了一种基于多模态信息抽取的工程图纸图签识别方法及系统,所述方法包括,获取工程图纸图像并对图像进行预处理,设定控制抽取目标和关系模式的数据结构Schema;通过训练好的图签检测模型检测图纸中的图签区域,得到每个图签的边界框坐标,将检测到的边界框坐标映射回原始图像的坐标系,并从原始图像中裁剪出对应的图签图像;对裁剪出的图签图像进行文本识别,提取出文本内容及对应的文本框坐标信息;将裁剪出的图签图像与文本识别结果输入至训练好的多模态信息抽取模型,并根据设定的Schema进行信息抽取,输出结构化的抽取结果。该方法可灵活定义抽取目标,支持二元组和三元组的统一抽取,抽取准确性高。
技术关键词
图签识别方法 多模态信息 工程图纸 文本识别 信息抽取模型 三元组 引导器 前馈神经网络 注意力机制 坐标系 模式 模型超参数 后处理模块 图像块 布局
系统为您推荐了相关专利信息
1
一种自动驾驶决策方法、系统、装置及介质
自动驾驶决策方法 多模态信息 信息编码 决策系统 动态更新
2
一种多模态显式记忆系统、装置、存储介质和程序产品
模态特征 跨模态 多模态信息 记忆系统 大语言模型
3
图像识别方法、装置、设备及存储介质
计算机执行指令 单据 字符 图像识别方法 字典
4
热敷贴片工艺参数动态寻优控制方法及系统
动态寻优控制方法 贴片工艺 三维网格模型 空间变换关系 迭代计算方法
5
训练数据获取方法及系统、文本识别方法、设备及介质
训练数据获取方法 文本行 文本识别方法 矩阵 图像
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号