摘要
本发明公开一种基于属性信息和大型基础模型的车辆目标检测方法,主干网络获取图像的原始特征;使用区域建议模块生成候选区域,由感兴趣区域对齐模块将候选区域与原始特征图对齐获得视觉特征;基于候选区域从原始图像中裁剪候选区域图像;通过视觉特征增强模块来提取各个候选区域图像的特征,得到增强特征;将视觉特征与增强特征拼接获得最终视觉表示;通过损失约束视觉表示和语义表示更相似,从而对齐视觉表示和语义表示来弥补语义的差异。本发明通过视觉特征增强模块增强主干网络提取的原始图像特征,通过属性表示学习模块将候选区域的属性向量组融合统一,最后采用利用对比学习方法来对齐视觉表示和语义表示来弥补语义的差异。
技术关键词
视觉特征
语义
令牌
图像
文本
门控循环单元
车辆
编码器
对齐模块
基础
输出特征
标签
多层感知器
感兴趣
学习方法
网络
线性
坐标
系统为您推荐了相关专利信息
焦点损失函数
集成模块
注意力机制
特征融合网络
算法架构
模板页面
字段
计算机可读非暂时性存储介质
图标
软件包
单目视觉信息
拖挂车辆
柔性
3D点云
单目视觉相机
抓取网络
抓取方法
图像像素
抓取轨迹
生成透明物体