摘要
本发明公开了基于场景结构信息引导的视觉目标检测方法及系统,获取检测图像并计算其消失点位置,基于消失点构建高斯函数,生成场景结构表达式;构建神经网络学习场景结构,通过将骨干网络中多个特征图拼接并输入轻量化卷积网络,学习图像中的场景结构特征,缓解不同尺度目标间的特征混淆问题;利用多层感知机对场景结构特征进行编码,生成基于场景结构的注意力图;通过得到的注意力图调制特征金字塔中的特征张量,完成后续目标检测任务;通过训练损失函数优化神经网络,提升检测精度。本发明能够有效利用场景结构信息,提高视觉目标检测的鲁棒性和准确性,特别在多尺度目标检测中具有明显优势。
技术关键词
场景结构
结构特征提取
特征金字塔
视觉
注意力
多层感知机
直线段
训练神经网络模型
编码模块
损失函数优化
超定方程组
坐标
图像特征提取
表达式
调制特征