一种基于多模态信息抽取的工程图纸图签识别方法及系统

AITNT
正文
推荐专利
一种基于多模态信息抽取的工程图纸图签识别方法及系统
申请号:CN202510450366
申请日期:2025-04-11
公开号:CN119964171B
公开日期:2025-07-11
类型:发明专利
摘要
本发明公开了一种基于多模态信息抽取的工程图纸图签识别方法及系统,所述方法包括,获取工程图纸图像并对图像进行预处理,设定控制抽取目标和关系模式的数据结构Schema;通过训练好的图签检测模型检测图纸中的图签区域,得到每个图签的边界框坐标,将检测到的边界框坐标映射回原始图像的坐标系,并从原始图像中裁剪出对应的图签图像;对裁剪出的图签图像进行文本识别,提取出文本内容及对应的文本框坐标信息;将裁剪出的图签图像与文本识别结果输入至训练好的多模态信息抽取模型,并根据设定的Schema进行信息抽取,输出结构化的抽取结果。该方法可灵活定义抽取目标,支持二元组和三元组的统一抽取,抽取准确性高。
技术关键词
图签识别方法 多模态信息 工程图纸 文本识别 信息抽取模型 三元组 引导器 前馈神经网络 注意力机制 坐标系 模式 模型超参数 后处理模块 图像块 布局
系统为您推荐了相关专利信息
1
基于上下文信息的实体及实体关系确定方法及信息抽取模型的训练方法
实体 信息抽取模型 关系 标签 核心
2
图像处理方法、计算设备、存储介质及计算机程序产品
图像处理方法 数据存储单元 图像分类模型 计算机程序产品 文本识别
3
一种标准式行星滚柱丝杠副工程图自动生成方法及系统
行星滚柱丝杠 自动生成方法 人机交互界面 控件 零件
4
识别微电子组装电路字符的方法及装置
混合模块 文本识别 管壳 电路 硬件设备
5
一种基于OCR方法的计量器具溯源证书数据化处理平台及方法
证书数据 计量器具 表格 文本识别 扫描仪
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号