摘要
本发明提供了一种基于注意力机制的多模态三维目标检测方法,该方法包括:获取图像数据及LiDAR点云数据,并对其进行预处理,对处理后的图像数据及LiDAR点云数据进行特征提取,基于双向信息交互的多模态特征融合算法对提取的图像特征及点云特征进行融合,对融合后的特征进行优化,消除冗余和噪声,同时,在特定的感兴趣区域内,对融合特征进行精细化处理,将融合及优化后的特征输入目标检测模块,通过候选框生成、分类和回归任务,完成多模态三维目标的分类、定位和识别,基于非极大抑制算法,去除冗余的检测框,输出检测结果,包括目标的类别标签、边界框坐标以及置信度分数。本发明提升了多模态融合的效率和检测精度,便于使用。
技术关键词
双向信息交互
交叉注意力机制
模态特征
融合算法
图像
数据
抑制算法
卷积神经网络提取
局部结构特征
分支
融合特征
深度学习方法
冗余
点云滤波
多模态
特征提取模块
感兴趣
纹理特征
系统为您推荐了相关专利信息
养殖场环境
动物健康状况
大数据平台
风险预测模型
预警系统
水下检测机器人
三维点云数据
风险评估模型
立体视觉系统
多传感器融合技术
膝关节镜手术
序列帧
图像
卷积神经网络模型
卷积神经网络识别
现场视频图像
人体姿态数据
三维人体模型
人体轮廓
参数