摘要
本发明涉及一种地铁列车环境下基于BEV的纯视觉3D目标检测方法,属于计算机视觉技术领域,解决了现有技术中地铁列车环境视图转换复杂、计算成本高的问题,包括:步骤S1、获取环境视频数据集;步骤S2、划分为多个环境视频,得到图像训练集;步骤S3、对图像训练集中的环境视频进行逐帧处理,提取多尺度的图像特征,构成特征图,并初始化得到一组稀疏的支柱查询;步骤S4、对BEV空间中的初始化后的多尺度的图像特征进行聚合,得到聚合后的查询;步骤S5、生成一组采样偏移量,生成采样点,提取特征,并得到动态加权融合后的特征;步骤S6、进行分类和预测,得到3D物体检测框及其类别标签作为预测结果;步骤S7、输出得用于自动驾驶系统的障碍物识别与避让。
技术关键词
地铁列车
物体检测框
采样点
特征金字塔网络
图像
视频
自动驾驶系统
障碍物识别
查询特征
动态
注意力机制
坐标系
多尺度
计算机视觉技术
训练集
支柱
标签
参数
系统为您推荐了相关专利信息
倾斜摄影三维模型
精度
纹理
顶点
三维数据处理技术
图像生成网络
图像生成方法
染色
病理切片图像
预训练语言模型
变电站SCD文件
生成方法
数据处理机
图像识别技术识别
AI算法
声呐图像分割方法
模块
图像分割装置
网络
可读存储介质