一种基于动态损失去偏的视觉问答模型训练方法和系统

正文

推荐专利

申请号：CN202510468877

申请日期：2025-04-15

公开号：CN120448575A

公开日期：2025-08-08

类型：发明专利

摘要

公开了一种基于动态损失去偏的视觉问答模型训练方法和系统，包括根据训练数据的答案频率和样本偏差检测结果动态调整损失函数的边距参数，其中，答案频率通过统计给定问题类型下每个答案的出现次数，生成与答案频率成反比的动态边距，样本偏差检测通过引入独立偏差检测分支，基于问题文本预测偏差置信度，生成与偏差程度呈正比的动态边距；将基于答案频率的动态边距与基于偏差检测的动态边距加权融合，形成最终动态边距；使用融合后的动态边距损失函数优化视觉问答模型，并结合交叉熵损失和偏差检测分支的损失进行联合训练。本申请能够增强模型对长尾分布答案的预测能力，提高低频答案的识别准确性，改善模型在视觉问答任务上的整体泛化性能。

技术关键词

视觉问答模型答案动态偏差损失函数优化分支频率 Softmax函数文本神经网络模型训练系统参数度函数可读存储介质计算机数据标签样本索引

一种基于动态损失去偏的视觉问答模型训练方法和系统

站点导航

APP 下载