摘要
本发明适用于三维目标检测技术领域,提供了基于模态间双向交互和渐进推理的3D目标检测方法及装置。本发明通过对输入的激光雷达点云和多视角图像进行独立特征提取;进行跨模态注意力交互、残差细化和模态内局部自注意力计算,获取增强特征数据;进行跨模态推理和目标解码,生成融合特征数据;输入至前馈神经网络,通过全连接层生成最终三维目标检测结果。能够实现几何信息与语义特征的双向动态补偿,采用渐进式推理机制逐层优化跨模态特征表达,并设计场景自适应的动态融合策略,有效提升遮挡场景下小目标检测的完整性、复杂光照条件下目标定位的准确性以及远距离目标感知的稳定性,同时保障多模态感知系统在动态环境中的鲁棒性。
技术关键词
跨模态
多视角
前馈神经网络
融合特征
交叉注意力机制
模态特征
交互特征
多模态感知系统
双向动态补偿
特征提取单元
解码
数据
激光雷达点云
细粒度特征
图像特征提取
遮挡场景
系统为您推荐了相关专利信息
空间金字塔
多尺度特征
色彩校正
Sigmoid函数
融合特征
剔除系统
蒙特卡洛
构建三维场景
多模态特征融合
决策
快速检索方法
多模态
长短期记忆网络
特征提取模型
梅尔频率倒谱系数
时空融合特征
时空图卷积神经网络
交易量预测方法
卷积特征
节点
数据
智能制冰机
故障预警方法
深度神经网络
分支