摘要
本发明公开了一种基于频域与空间域结合的飞鸟场景多模态图像融合方法,属于多模态图像融合的技术领域,其包括:构建飞鸟场景的多源异构数据集;构建融合频域与空间域的双光图像融合网络模型;将可见光图像和红外图像分别输入双光图像融合网络模型中,并分别输出可见光融合特征图和红外融合特征图;采用跨模态注意力机制进行可见光融合特征图和红外融合特征图的自适应融合,得到多模态融合图像。本发明融合多种频域增强技术与空间域处理方法,实现了鸟类可见光图像与红外图像的高精度融合。
技术关键词
拉普拉斯金字塔
可见光图像
融合特征
神经网络结构
频域特征
离散余弦变换
多尺度特征提取
多模态
场景
跨模态
峰值信噪比
分支
像素点
注意力机制
卷积模块
图像像素
系统为您推荐了相关专利信息
Doherty功放
匹配网络
优化设计方法
混合优化算法
载波功率放大器
边缘检测
图像分割方法
融合特征
编码器
跟骨骨折
摄像机
多模态深度学习
智能检索方法
融合特征
智能检索系统
残差模块
卷积神经网络设计
红外光
可见光图像
输出特征
视觉特征
推理方法
手术场景
交叉注意力机制
多模态