摘要
本发明公开一种基于异质性感知注意力融合网络多模态图像目标检测方法,针对复杂场景下目标检测难题,利用双主干网络,分别对可见光和红外图像进行多尺度特征提取,生成包含不同层级细节与语义信息的特征金字塔,通过异质感知增强模块,构建通道‑空间双向注意力机制,对不同层级特征进行跨模态异质增强,凸显关键区域信息,借助精细化通道注意力融合模块,有效放大区分性特征同时抑制模态特定噪声,在目标检测环节,采用椭圆动态CIoU损失函数,依目标占比动态选择外接或内接椭圆计算交并比,优化锚框与目标的几何对齐,本发明有效提升多模态图像目标检测精度与鲁棒性,在自动驾驶及异常检测等领域中具有广阔的应用前景。
技术关键词
双向注意力机制
多模态
特征金字塔
通道
异质
模态特征
可见光
图像
关键区域信息
动态
跨模态
网络
多尺度特征提取
模块
浅层特征提取
多尺度池化
矩形
全局平均池化
层级
系统为您推荐了相关专利信息
风险控制策略
深度学习技术
多元化策略
卫星图像数据
预测时间序列数据
蒙特卡洛树
实体
kmeans算法
相关度计算方法
计算机程序指令
评价计算方法
图像语义分割
孔隙结构
黄土
监测单元
YOLO模型
滑坡检测方法
地形遥感数据
检测头
分支