视觉问答模型的训练方法、视觉问答方法及系统

AITNT
正文
推荐专利
视觉问答模型的训练方法、视觉问答方法及系统
申请号:CN202410883023
申请日期:2024-07-02
公开号:CN118798373A
公开日期:2024-10-18
类型:发明专利
摘要
本公开关于一种视觉问答模型的训练方法、视觉问答方法及系统,所述训练方法包括:获取训练样本集和样本标注信息;将每个训练样本的样本图像和样本提问数据输入到所述视觉问答模型,得到针对所述样本提问数据的预测答案和预测解释数据;基于所述预测答案、所述预测解释数据以及所述样本标注信息,对所述视觉问答模型进行训练。根据本公开的视觉问答模型的训练方法、视觉问答方法及系统可以解决在给出预测推理结果时无法给出推理过程的问题,可以在给出预测推理结果时给出预测解释数据,使用户在获取预测答案的同时还可以了解模型的推理过程,便于验证推理过程的合理性和准确性,这样的多模态解释数据更便于阅读和理解,对用户友好。
技术关键词
视觉问答模型 视觉问答方法 样本 答案 视觉特征 数据 图像 编码器 计算机可执行指令 问答系统 训练系统 处理器 电子设备 可读存储介质 计算机程序产品 文本
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号