摘要
本发明公开了一种基于对比学习和结构化信息增强多模态特征融合的方法,基于对比学习的多模态网络,通过利用结构化信息构造的正负样本数据,充分挖掘模态特征之间的对应关系,基于对应关系,注入结构化信息增强模态特征的融合;本发明通过对原始数据集中成对的图片、文本对中的文本数据进行结构化处理,获取文本数据中的对象、对象关系、对象属性等信息构造文本语义负样本和结构知识特征,结构知识特征注入到文本特征中后,在对比学习模块中与文本正样本和图片数据一起进行特征对齐,基于对齐特征送入特征融合模块进行特征融合。本发明充分利用文本模态的结构信息进行特征对齐以及利用融合特征进行联合优化,极大地提升了模型的多模态理解能力。
技术关键词
多模态特征融合
文本编码器
视觉特征
图片
样本
矩阵
对象
解码器
中央处理器
GPU处理器
数据
语义
模块
BERT模型
关系
答案
系统为您推荐了相关专利信息
多元线性回归模型
皮肤修护功效
红斑
测试仪
数据
船舶轨迹预测方法
轨迹预测模型
序列
采样点
训练样本数据
历史数据管理
深度学习模型
数据可视化
项目
视频检测功能