摘要
本申请实施例提供了一种多模态文档解析方法和装置、电子设备及存储介质,属于文档处理技术领域。该方法包括:获取目标多模态文档;其中,多模态文档包含至少两个原始模态类别的文档;根据原始模态类别对目标多模态文档进行分类,得到目标分类信息;其中,目标分类信息包括目标内容数据、目标模态类别和目标内容位置信息;根据目标模态类别从预设内容解析模块筛选出目标解析模块;基于目标解析模块对目标内容数据进行内容解析,得到目标内容解析信息;根据目标内容解析信息进行主题提取,得到目标主题信息;根据目标主题信息和目标内容位置信息对目标内容解析信息进行信息合并,得到目标解析文档。本申请实施例能够精准的解析多模态文档。
技术关键词
文档解析方法
多模态
主题
模块
数据
聚类
电子设备
摘要
可读存储介质
解析装置
关键词
处理器
文本
存储器
计算机
词语
系统为您推荐了相关专利信息
多层神经网络模型
模型计算方法
站点
最小化误差
GNSS观测值
噪声强度系数
量化评估方法
典型日负荷曲线
工业
量化评估系统
垃圾焚烧给料器
智能控制模型
智能控制系统
DCS控制器
垃圾焚烧发电厂
金属锂电解槽
自动给料系统
激光定位器
料仓单元
电磁密封环