多层次跨模态协同特征编码器结构

AITNT
正文
推荐专利
多层次跨模态协同特征编码器结构
申请号:CN202410964160
申请日期:2024-07-17
公开号:CN118967468A
公开日期:2024-11-15
类型:发明专利
摘要
本发明聚焦于多模态图像融合领域,提出一种多层次跨模态协同特征编码器结构。步骤1:将红外数据集与可见光数据集进行尺寸归一化处理;步骤2:将红外图像和可见光图像分别输入到Transformer进行初步融合及提取特征;步骤3:将红外图像和可见光图像输入到CNN网络进行融合及提取特征;步骤4:将两种网络提取出的特征通过CBAM模块进行空间和通道注意力加权后融合。在本发明中,针对多模态特征融合效果不佳的问题,将两种网络分别提取特征后通过CBAM模块进行空间和通道注意力加权,有效保留红外图像在低光、夜间等恶劣情况下的热辐射信息和可见光图像的细节和颜色信息,可用于军事侦察、安防系统、医学诊断等领域。
技术关键词
可见光图像 编码器结构 跨模态 多层次 双线性插值 注意力 多模态特征融合 多尺度特征融合 元素 通道 上采样 安防系统 模块 网络 尺寸 训练集
系统为您推荐了相关专利信息
1
一种用于远程取证的轻量离线身份验证方法及装置
人脸特征向量 身份验证方法 离线 画面 视频
2
一种基于视角范围增强的单目三维重建训练方法、可编辑方法及结合位姿进行三维推理的方法
三维重建模型 编辑方法 视角 物体 顶点
3
一种基于多层次相似性转移和自适应融合数据增强的小样本目标检测方法
样本 训练检测模型 视觉 代表 多层次
4
全天候RAG智能体自动报纸设计的方法、装置和电子设备
报纸 树形结构 多层次 动态实时数据 摘要
5
一种基于视觉与语言的无人机导航方法、装置、终端设备及存储介质
无人机导航方法 地标 六自由度动力学模型 交叉注意力机制 自然语言
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号