基于属性信息和大型基础模型的车辆目标检测方法

AITNT
正文
推荐专利
基于属性信息和大型基础模型的车辆目标检测方法
申请号:CN202410760844
申请日期:2024-06-13
公开号:CN118657924B
公开日期:2025-03-28
类型:发明专利
摘要
本发明公开一种基于属性信息和大型基础模型的车辆目标检测方法,主干网络获取图像的原始特征;使用区域建议模块生成候选区域,由感兴趣区域对齐模块将候选区域与原始特征图对齐获得视觉特征;基于候选区域从原始图像中裁剪候选区域图像;通过视觉特征增强模块来提取各个候选区域图像的特征,得到增强特征;将视觉特征与增强特征拼接获得最终视觉表示;通过损失约束视觉表示和语义表示更相似,从而对齐视觉表示和语义表示来弥补语义的差异。本发明通过视觉特征增强模块增强主干网络提取的原始图像特征,通过属性表示学习模块将候选区域的属性向量组融合统一,最后采用利用对比学习方法来对齐视觉表示和语义表示来弥补语义的差异。
技术关键词
视觉特征 语义 令牌 图像 文本 门控循环单元 车辆 编码器 对齐模块 基础 输出特征 标签 多层感知器 感兴趣 学习方法 网络 线性 坐标
系统为您推荐了相关专利信息
1
基于改进YOLOv9算法的早期火灾烟雾检测方法及系统
焦点损失函数 集成模块 注意力机制 特征融合网络 算法架构
2
利用大语言模型控制软件或硬件的系统与方法
大语言模型 中间件 指令 文本 输出日志文件
3
对目标应用进行配置的方法、设备和存储介质
模板页面 字段 计算机可读非暂时性存储介质 图标 软件包
4
基于单目视觉的柔性拖挂检测方法及系统
单目视觉信息 拖挂车辆 柔性 3D点云 单目视觉相机
5
一种基于深度补全的透明物体识别与抓取方法
抓取网络 抓取方法 图像像素 抓取轨迹 生成透明物体
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号