摘要
本发明属于目标检测技术领域,具体是指基于多模态融合的快速目标检测算法,包括数据采集与标定,同步获取图像与点云并完成内外参标定;对图像进行缩放等数据增强操作,对点云实施Pillar‑化等增强,并共享几何变换保持双模态对齐;利用YOLOv5网络获得二维边界框及置信度;利用PointPillars网络获得三维边界框并输出投影框及置信度;按标定矩阵将三维边界框投影至像素平面形成边界框;当交并比大于0.5时生成匹配对;把每个匹配对编码为14维向量;将向量输入多层感知机,通过几何与语义一致性筛选,有效抑制了单模态误检,14维输入特征通过三隐藏层MLP学习多模态边界框的非线性关系,显著提升了融合精度。
技术关键词
多模态
算法
多层感知机
双模态
网络
输入结构
图像
语义
数据
像素
编码
矩阵
非线性
旁路
广义
时延
传感器
分支
阶段
动态
系统为您推荐了相关专利信息
智能温度控制系统
PID算法
微控制器
继电器驱动控制
数字温度传感器
脑力负荷水平
动态神经网络
非线性动力学模型
径向基函数神经网络
识别器
LSTM模型
监测方法
光流算法
高斯核函数
阶段
多层异构网络
智能告警
故障传播路径
溯源方法
设备状态数据