用于多模态融合的数据对齐处理方法及装置

AITNT
正文
推荐专利
用于多模态融合的数据对齐处理方法及装置
申请号:CN202410901937
申请日期:2024-07-05
公开号:CN118761027A
公开日期:2024-10-11
类型:发明专利
摘要
本说明书实施例提供用于多模态融合的数据对齐处理方法及装置,其中方法包括:采集图像数据,确定图像数据对应的文本数据;将图像数据通过图像编码器确定图像高维特征,以及将文本数据通过文本编码器确定文本高维特征;将文本高维特征和图像高维特征输入特征对齐模块,确定文本对齐特征和图像对齐特征;将图像对齐特征输入文本解码器,以及将文本对齐特征输入图像编码器,对解码器进行特征修正,生成目标图像和目标文本,可以实现在图像文本相互生成中,生成相似度高的样本也能促进两个模态的数据对齐,提高多模态特征融合的充分程度。
技术关键词
图像高维特征 图像编码器 文本编码器 计算机可执行指令 对齐模块 图像解码器 多模态特征融合 学习方法 数据采集模块 处理器 可读存储介质 存储器
系统为您推荐了相关专利信息
1
一种基于多源遥感图像的舰船目标识别与检索方法
图像特征向量 图像编码器 检索方法 多源遥感图像数据 文本编码器
2
劲性结构梁柱节点钢筋智能优化排布方法及设备
优化排布方法 劲性结构梁柱节点 参数 模型训练模块 人工智能方法
3
基于多模态感知与边缘协同的轨道交通环境智能监测系统
轨旁环境感知 多模态 视频流 智能监测系统 智能监测方法
4
一种海上目标检测方法、装置、设备和存储介质
激光雷达 坐标点 滤波算法 动态 点云
5
一种基于谷歌足球模拟器的强化学习方法
足球比赛视频 强化学习方法 模拟器 训练样本集 大语言模型
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号