基于动态平衡特征空间调整的视觉问答方法及系统

正文

推荐专利

申请号：CN202510974985

申请日期：2025-07-15

公开号：CN120822617A

公开日期：2025-10-21

类型：发明专利

摘要

本发明提出了基于动态平衡特征空间调整的视觉问答方法及系统，涉及人工智能与多模态机器学习技术领域，针对的问题是：现有技术存在语言先验问题，忽视视觉信息的充分利用，导致泛化能力下降，难以针对具体样本进行动态调整。该方法获取相关的视觉问答样本数据，通过图像‑文本联合特征提取器进行特征提取，通过多模态融合模块对提取的视觉图像特征和问题文本特征进行融合，并采用监督对比学习机制和加权融合，将融合特征分别输入至并行的动态平衡特征空间分支和稀有答案感知分支，分别得到对应的未归一化得分，进行加权融合和处理，得到最终问答结果。本发明解决现有技术存在的问题，提升了模型的鲁棒性与泛化能力，提高问答性能。

技术关键词

视觉问答方法融合特征联合特征提取答案样本文本编码器图像编码器分支分类器多模态动态更新数据机器学习技术计算机装置特征提取模块问答系统

系统为您推荐了相关专利信息

内河航运挥发性危化品泄漏气液两相影响评估方法及系统

气液两相注意力机制船舶覆盖率模式

通江湖泊水流交换量计算方法

时间序列预测模型计算方法水流加权特征注意力

机器人步态测试优化方法、装置、设备及存储介质

步态参数测试优化方法机器人步态关节能效

一种基于深度学习的媒资内容审核方法、设备及介质

内容审核方法人工智能模型样本媒资系统特征提取模型

一种电力领域指令微调样本集自动构建方法及装置

样本指令文本自动构建方法电力

基于动态平衡特征空间调整的视觉问答方法及系统

站点导航

APP 下载