基于注意力机制的多模态三维目标检测方法

AITNT
正文
推荐专利
基于注意力机制的多模态三维目标检测方法
申请号:CN202411890586
申请日期:2024-12-20
公开号:CN119810816A
公开日期:2025-04-11
类型:发明专利
摘要
本发明提供了一种基于注意力机制的多模态三维目标检测方法,该方法包括:获取图像数据及LiDAR点云数据,并对其进行预处理,对处理后的图像数据及LiDAR点云数据进行特征提取,基于双向信息交互的多模态特征融合算法对提取的图像特征及点云特征进行融合,对融合后的特征进行优化,消除冗余和噪声,同时,在特定的感兴趣区域内,对融合特征进行精细化处理,将融合及优化后的特征输入目标检测模块,通过候选框生成、分类和回归任务,完成多模态三维目标的分类、定位和识别,基于非极大抑制算法,去除冗余的检测框,输出检测结果,包括目标的类别标签、边界框坐标以及置信度分数。本发明提升了多模态融合的效率和检测精度,便于使用。
技术关键词
双向信息交互 交叉注意力机制 模态特征 融合算法 图像 数据 抑制算法 卷积神经网络提取 局部结构特征 分支 融合特征 深度学习方法 冗余 点云滤波 多模态 特征提取模块 感兴趣 纹理特征
系统为您推荐了相关专利信息
1
基于虚拟相机的多路直播画面合成系统及方法
画面 虚拟屏幕 顶点着色器 图像 模块
2
一种基于大数据平台的畜牧业环境监测和预警系统
养殖场环境 动物健康状况 大数据平台 风险预测模型 预警系统
3
一种水下检测机器人的鲁棒自主导航与避障方法
水下检测机器人 三维点云数据 风险评估模型 立体视觉系统 多传感器融合技术
4
一种基于深度学习的膝关节镜手术辅助方法及系统
膝关节镜手术 序列帧 图像 卷积神经网络模型 卷积神经网络识别
5
一种三维虚拟人视频合成方法、系统、设备及存储介质
现场视频图像 人体姿态数据 三维人体模型 人体轮廓 参数
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号