摘要
本发明图像处理技术领域,公开了一种融合跨视角模态双重动量对比学习的变化描述系统及方法,该变化描述系统包括输入模块,用于将待比较图像对中的两幅图像和文本描述转换为相应图像的视觉特征和词嵌入;单视角Transformer编码器,用于分别对每幅图像的视觉特征进行特征提取,获取每幅图像的不变性特征;跨视角Transformer编码器,用于匹配图像对中两幅图像的不变性特征并获得图像对的变化特征表示;单模态语言Transformer编码器,用于将词嵌入转换为语言特征表示;多模态Transformer解码器,用于对图像对的变化特征表示和语言特征表示进行融合,得到融合特征;输出模块,用于依据融合特征得到图像对的变化描述。本发明能够捕获关键的视觉不变性特征,增强变化描述。
技术关键词
图像
特征提取模块
样本
视觉特征
视角
队列
融合特征
前馈神经网络
多模态
输入模块
文本
输出模块
池化特征
解码器
梯度下降优化算法
矩阵
交叉注意力机制
语言编码器
系统为您推荐了相关专利信息
反射率
指数
高光谱成像系统
X射线荧光光谱
波长
传感器
景观
信号
特征点
非易失性计算机可读存储介质
血型鉴定方法
迁移学习模型
空间金字塔池化
对抗性
引入注意力机制
资源分配方法
信息接收器
网络
数据样本集合
构建无人机