一种基于生成对抗与样本优化的视觉问答方法及系统

正文

推荐专利

申请号：CN202510169692

申请日期：2025-02-17

公开号：CN119623652A

公开日期：2025-03-14

类型：发明专利

摘要

本发明提供了一种基于生成对抗与样本优化的视觉问答方法及系统，涉及视觉问答技术领域，所述方法包括：获取视觉问答任务中的问题和图像；将问题和图像输入训练好的视觉问答模型中，得到视觉问答结果；其中，视觉问答模型基于生成器构建偏差模型，将随机噪声向量转化为与图像特征表示相同维度的偏差特征，并根据输入的问题与偏差特征生成偏差答案向量；基于判别器区分答案的真假；通过生成器和判别器的交替训练，使偏差模型的答案分布逼近目标模型的答案分布；以最大化视觉问答模型对正确答案的预测概率为目标，联合训练生成对抗网络和视觉问答模型。本发明能够提升模型的多模态推理能力。

技术关键词

视觉问答模型视觉问答方法生成对抗网络答案偏差样本随机噪声图像多模态视觉问答技术策略问答系统计算机程序产品处理器标签指令可读存储介质存储器

系统为您推荐了相关专利信息

客服知识库更新方法、系统、计算机设备和存储介质

客服知识库会话知识点更新方法答案

一种MEMS自动校准安装误差的方法及系统

安装误差加速度校准 MEMS设备矩阵

一种用于常减压加热炉的管式空气预热器及其监控方法

管式空气预热器监控方法矩阵加热炉历史运行数据

基于大语言模型的错题纠错方法、系统及介质

大语言模型纠错方法语义向量学生答案

基于变论域模糊逻辑的智能船舶航向控制方法及系统

智能船舶航向控制方法模糊PID控制器模糊控制器模糊逻辑

一种基于生成对抗与样本优化的视觉问答方法及系统

站点导航

APP 下载