摘要
本发明公开了一种红外‑可见光联合目标检测方法,通过主干网络提取多尺度特征,并采用跨模态特征融合模块融合红外和可见光数据的空间和语义信息。同时,设计了改进的同尺度特征交互模块和基于卷积的跨尺度特征融合模块,进一步提升特征表达能力。融合后的特征经由Query Selection模块动态选择高质量初始对象查询,再由解码器输出目标类别和位置信息。该网络模型具有强大的多模态数据融合能力和高效的目标检测性能,适用于安防监控、自动驾驶等多种应用场景,尤其在复杂环境下表现优异。
技术关键词
融合特征
高层次
分辨率
跨模态
前馈神经网络
解码器结构
索引
红外光
模块
输入解码器
多尺度特征
上采样
可见光图像
语义
注意力机制