融合跨视角跨模态双重动量对比学习的变化描述系统及方法

AITNT
正文
推荐专利
融合跨视角跨模态双重动量对比学习的变化描述系统及方法
申请号:CN202411887871
申请日期:2024-12-20
公开号:CN119863683B
公开日期:2025-11-11
类型:发明专利
摘要
本发明图像处理技术领域,公开了一种融合跨视角模态双重动量对比学习的变化描述系统及方法,该变化描述系统包括输入模块,用于将待比较图像对中的两幅图像和文本描述转换为相应图像的视觉特征和词嵌入;单视角Transformer编码器,用于分别对每幅图像的视觉特征进行特征提取,获取每幅图像的不变性特征;跨视角Transformer编码器,用于匹配图像对中两幅图像的不变性特征并获得图像对的变化特征表示;单模态语言Transformer编码器,用于将词嵌入转换为语言特征表示;多模态Transformer解码器,用于对图像对的变化特征表示和语言特征表示进行融合,得到融合特征;输出模块,用于依据融合特征得到图像对的变化描述。本发明能够捕获关键的视觉不变性特征,增强变化描述。
技术关键词
图像 特征提取模块 样本 视觉特征 视角 队列 融合特征 前馈神经网络 多模态 输入模块 文本 输出模块 池化特征 解码器 梯度下降优化算法 矩阵 交叉注意力机制 语言编码器
系统为您推荐了相关专利信息
1
基于图像声纹多模态数据的配网电气设备缺陷识别方法
电气设备 内部缺陷特征 缺陷识别方法 图像 光强
2
一种利用高光谱成像技术评估石刻劣化模式的方法
反射率 指数 高光谱成像系统 X射线荧光光谱 波长
3
基于传感器信号的燃料电池故障诊断方法、设备及介质
传感器 景观 信号 特征点 非易失性计算机可读存储介质
4
基于对抗式迁移学习的罕见血型鉴定方法、介质及设备
血型鉴定方法 迁移学习模型 空间金字塔池化 对抗性 引入注意力机制
5
无人机辅助下基于EH的BackCom网络的资源分配方法及系统
资源分配方法 信息接收器 网络 数据样本集合 构建无人机
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号