摘要
本发明公开了一种基于多粒度边际的重加权方法,属于计算机视觉问答技术领域。先预处理训练数据,依据问题在问题类型和具体问题两种不同划分粒度下计算各答案概率值,通过概率值和答案整体分布的相似性度量边际的不确定性,并以此为多粒度边际权重与问题类型边际加权求和,得到融合多粒度信息的边际损失函数。再经梯度引导,以答案与图像特征间的梯度值量化图像贡献度作为调整因子修正边际,通过调整样本权重使重加权模型可识别不同难度样本。本发明关注到统计分布下问题和答案之间的粗细粒度关系,用重新加权的方法有效缓解了数据分布不平衡所致的语言偏差,同时关注到区别对待不同分类难度样本,提升了模型在分布外数据集上的鲁棒性与准确性。
技术关键词
答案
加权方法
样本
视觉问答模型
分类器
融合多粒度信息
图像块特征
问答技术
缩放方法
预测类别
因子
计算机视觉
注意力机制
数据分布
文本
度量
动态地
系统为您推荐了相关专利信息
特征提取网络
样本
注意力机制
迁移学习策略
分支
文本推荐方法
大语言模型
答案
计算机可读指令
专利技术
多层神经网络模型
预测模型训练方法
历史运行数据
粒子群算法
在线
孤独症谱系障碍
融合特征
分类方法
对象
注意力机制