摘要
本申请提供一种基于文档图像的问答方法、装置、设备、存储介质及程序产品。涉及人工智能领域。该方法包括:获取目标文档图像及对应的问题相关信息,并将目标文档图像输入至预设版面分析模型中;采用预设版面分析模型确定目标文档图像中的至少一个目标版面类型标识及目标版面类型标识在目标文档图像中的区域信息;对问题相关信息、至少一个目标版面类型标识及目标版面类型标识在目标文档图像中的区域信息依次进行拼接及编码得到文本特征信息;获取图像特征信息,并采用预设对齐策略对图像特征信息以及文本特征信息进行对齐得到图文对齐信息;基于图文特征信息及预设问答模型确定目标文档图像对应的问题答复信息。提高文档图像问答的准确性。
技术关键词
图像特征信息
标识
问答模型
计算机执行指令
图文
问答方法
文本
表格
可读存储介质
问答装置
图片
编码策略
计算机程序产品
处理器通信
模块
存储器
系统为您推荐了相关专利信息
异常检测方法
异常数据
样本
特征融合网络
文本特征向量
网络设备
资源泄露检测方法
网络系统
计算机执行指令
关系
众包平台
验证子系统
预警管理系统
信息验证系统
隐私保护系统