基于场景结构信息引导的视觉目标检测方法及系统

正文

推荐专利

申请号：CN202510758572

申请日期：2025-06-09

公开号：CN120931888A

公开日期：2025-11-11

类型：发明专利

摘要

本发明公开了基于场景结构信息引导的视觉目标检测方法及系统，获取检测图像并计算其消失点位置，基于消失点构建高斯函数，生成场景结构表达式；构建神经网络学习场景结构，通过将骨干网络中多个特征图拼接并输入轻量化卷积网络，学习图像中的场景结构特征，缓解不同尺度目标间的特征混淆问题；利用多层感知机对场景结构特征进行编码，生成基于场景结构的注意力图；通过得到的注意力图调制特征金字塔中的特征张量，完成后续目标检测任务；通过训练损失函数优化神经网络，提升检测精度。本发明能够有效利用场景结构信息，提高视觉目标检测的鲁棒性和准确性，特别在多尺度目标检测中具有明显优势。

技术关键词

场景结构结构特征提取特征金字塔视觉注意力多层感知机直线段训练神经网络模型编码模块损失函数优化超定方程组坐标图像特征提取表达式调制特征

基于场景结构信息引导的视觉目标检测方法及系统

站点导航

APP 下载