摘要
本发明公开了一种基于多模态社会最优模型的优化方法,属于多模态学习领域,特别适用于视频数据的高效融合。本发明提出了一种基于多模态社会最优模型的优化方法,对单模态在多模态学习中的梯度大小和方向进行调整,并定义了多模态效用与多模态嫉妒,用于分别衡量各模态对模型性能的贡献以及减少模型对特定模态的偏向性。通过该方法,实现了多模态数据间的高效融合。本发明所提出的模型能够有效缓解多模态学习中的模态不平衡问题,具有广泛的应用前景,可推广至多种多模态融合场景。
技术关键词
学习方法
多模态特征
音频特征
多模态分类器
视频
深度卷积神经网络模型
代表
线性求解器
随机梯度下降
参数
融合场景
融合方法
视觉特征
社会
资源分配
定义
系统为您推荐了相关专利信息
患者
语音记录设备
医疗监控设备
大数据技术
音视频
模型训练方法
网络结构
语音识别模型
节点
模型训练装置