摘要
本发明公开一种面向民机制造多模态数据的追溯方法和系统,获取原始多模态工艺文件,对多模态工艺文件进行文本解析,得到结构化文件;将结构化文件以页为识别单位进行切分,采用经过预训练的OCR模型对切分文件逐页进行图像识别,根据识别出的章节以及各章节下的文本内容、图片内容、表格内容形成结构化识别记录;建立结构化文件与结构化识别记录之间的数据映射关系,形成对结构化文件的溯源信息标记;将结构化文件中的文档层信息、章节层信息和区块层信息分别以实体形式存储建立知识图谱并提供多模态数据的溯源查询。本发明将文本解析结果与OCR识别结果相结合,并通过知识图谱展示溯源,满足现有民机制造过程中多模态工艺文件高精准度的溯源需求。
技术关键词
追溯方法
多模态
数据映射关系
表格数据结构
文本数据结构
图片
溯源信息
图谱
坐标
实体
追溯系统
标记
物理
处理器
计算机设备
字段
识别模块
系统为您推荐了相关专利信息
多模态感知系统
实时仿真系统
密封裙板
送风系统
子模块
10kV母线电压
变压器分接头
电压越限
无功补偿装置容量
调压策略
动态监测系统
多模态数据融合
结构方程模型
视频
多模态数据采集
图形用户界面
双系统
定位方法
整体布局结构
多模态
高效液相色谱仪
多模态数据融合
数据传输模块
数据分析模块
多模态数据分析