摘要
本公开关于一种视觉问答模型的训练方法、视觉问答方法及系统,所述训练方法包括:获取训练样本集和样本标注信息;将每个训练样本的样本图像和样本提问数据输入到所述视觉问答模型,得到针对所述样本提问数据的预测答案和预测解释数据;基于所述预测答案、所述预测解释数据以及所述样本标注信息,对所述视觉问答模型进行训练。根据本公开的视觉问答模型的训练方法、视觉问答方法及系统可以解决在给出预测推理结果时无法给出推理过程的问题,可以在给出预测推理结果时给出预测解释数据,使用户在获取预测答案的同时还可以了解模型的推理过程,便于验证推理过程的合理性和准确性,这样的多模态解释数据更便于阅读和理解,对用户友好。
技术关键词
视觉问答模型
视觉问答方法
样本
答案
视觉特征
数据
图像
编码器
计算机可执行指令
问答系统
训练系统
处理器
电子设备
可读存储介质
计算机程序产品
文本