摘要
本发明公开了一种视觉文档内容提取及分析系统和方法,该系统包括多任务统一建模模块和内容提取与信息抽取解码模块,多任务统一建模模块包括多模态特征提取子模块、多模态表征优化子模块、任务提示生成子模块,内容提取与信息抽取解码模块包括所述的内容提取与信息抽取解码模块包括、统一解码子模块。该方法包括步骤:S1、通过多任务统一建模模块提取文档图像的多模态特征,并生成任务提示向量;S2、基于所述多模态特征与任务提示向量,利用内容提取与信息抽取解码模块同步完成文档区域解析、语义标签分配及结构化信息输出。本发明统一建模实现了多任务的统一处理,有效解决了传统方法中任务分离带来的效率损失和一致性问题。
技术关键词
联合损失函数
解码模块
分析系统
语义标签
子模块
多任务
文档测试
分析方法
多模态特征
布局算法
融合视觉特征
解码器
文本
图像
生成文档
系统为您推荐了相关专利信息
辅助诊疗系统
数据导入模块
风险控制模型
数据处理模块
患者
数据分析框架
生成对抗网络
编码器
数据分析方法
空中交通管理
风险分析方法
数据建立时间
ARIMA模型
度量
风险分析系统