摘要
本说明书实施例提供用于多模态融合的数据对齐处理方法及装置,其中方法包括:采集图像数据,确定图像数据对应的文本数据;将图像数据通过图像编码器确定图像高维特征,以及将文本数据通过文本编码器确定文本高维特征;将文本高维特征和图像高维特征输入特征对齐模块,确定文本对齐特征和图像对齐特征;将图像对齐特征输入文本解码器,以及将文本对齐特征输入图像编码器,对解码器进行特征修正,生成目标图像和目标文本,可以实现在图像文本相互生成中,生成相似度高的样本也能促进两个模态的数据对齐,提高多模态特征融合的充分程度。
技术关键词
图像高维特征
图像编码器
文本编码器
计算机可执行指令
对齐模块
图像解码器
多模态特征融合
学习方法
数据采集模块
处理器
可读存储介质
存储器
系统为您推荐了相关专利信息
图像特征向量
图像编码器
检索方法
多源遥感图像数据
文本编码器
优化排布方法
劲性结构梁柱节点
参数
模型训练模块
人工智能方法
轨旁环境感知
多模态
视频流
智能监测系统
智能监测方法
足球比赛视频
强化学习方法
模拟器
训练样本集
大语言模型