摘要
本发明属于图像处理技术领域,涉及一种跨模态注意力融合机制的光学‑红外目标检测方法,通过引入隐式神经表示,将多模态特征从传统的离散像素网格提升至一个连续的函数空间,学习并构建一个从空间坐标到特征向量的连续映射函数;旨在借助一种新颖的隐式注意力机制,支持在任意查询坐标点自适应地聚合目标模态的特征信息,突破了传统方法在感受野和对齐精度上的瓶颈;本方法通过基于隐式神经表示的连续性优势,实现了不同尺度特征的无损对齐,充分挖掘尺度间的互补信息以提升融合效果。本发明通过将隐式神经表示与Mamba架构相结合,将跨模态融合从离散空间拓展至连续函数空间,在提升检测鲁棒性与泛化能力的同时,保持了模型的计算效率。
技术关键词
离散特征
跨模态
连续特征
融合特征
注意力机制
感知特征
状态空间模型
查询机制
坐标点
双线性插值
多层感知器
可见光图像
图像处理技术
序列
模态特征
网格
系统为您推荐了相关专利信息
疲劳驾驶检测
多模态数据融合
疲劳特征
行车记录仪
提醒方法
检测跟踪一体化
卡尔曼滤波
匈牙利算法
图像
运动参数估计
射线
引入注意力机制
感兴趣区域提取
残差模块
图像增强