基于注意力机制的多模态三维目标检测方法

正文

推荐专利

基于注意力机制的多模态三维目标检测方法

申请号：CN202411890586

申请日期：2024-12-20

公开号：CN119810816A

公开日期：2025-04-11

类型：发明专利

摘要

本发明提供了一种基于注意力机制的多模态三维目标检测方法，该方法包括：获取图像数据及LiDAR点云数据，并对其进行预处理，对处理后的图像数据及LiDAR点云数据进行特征提取，基于双向信息交互的多模态特征融合算法对提取的图像特征及点云特征进行融合，对融合后的特征进行优化，消除冗余和噪声，同时，在特定的感兴趣区域内，对融合特征进行精细化处理，将融合及优化后的特征输入目标检测模块，通过候选框生成、分类和回归任务，完成多模态三维目标的分类、定位和识别，基于非极大抑制算法，去除冗余的检测框，输出检测结果，包括目标的类别标签、边界框坐标以及置信度分数。本发明提升了多模态融合的效率和检测精度，便于使用。

技术关键词

双向信息交互交叉注意力机制模态特征融合算法图像数据抑制算法卷积神经网络提取局部结构特征分支融合特征深度学习方法冗余点云滤波多模态特征提取模块感兴趣纹理特征

系统为您推荐了相关专利信息

基于虚拟相机的多路直播画面合成系统及方法

画面虚拟屏幕顶点着色器图像模块

一种基于大数据平台的畜牧业环境监测和预警系统

养殖场环境动物健康状况大数据平台风险预测模型预警系统

一种水下检测机器人的鲁棒自主导航与避障方法

水下检测机器人三维点云数据风险评估模型立体视觉系统多传感器融合技术

一种基于深度学习的膝关节镜手术辅助方法及系统

膝关节镜手术序列帧图像卷积神经网络模型卷积神经网络识别

一种三维虚拟人视频合成方法、系统、设备及存储介质

现场视频图像人体姿态数据三维人体模型人体轮廓参数

基于注意力机制的多模态三维目标检测方法

站点导航

APP 下载