基于图像-文本融合增强的多模态泊车检测系统

正文

推荐专利

申请号：CN202411964800

申请日期：2024-12-30

公开号：CN119672678A

公开日期：2025-03-21

类型：发明专利

摘要

本发明公开了一种基于图像‑文本融合增强的多模态泊车检测系统，多视角摄像头输入图像信息，摄像头特征提取模块提取多视角摄像头图像特征，图像特征空间转换模块，将多视角摄像头图像融合至bev视角，实现多视角图像特征到bev特征的转换；输入文本模态信息，文本特征提取模块提取用户意图文本特征；多模态特征融合模块，获得文本特征和bev特征后，多模态特征通过多通路的特征融合模块进行充分交融；多模态decoder模块，基于transformer的解码结构，输出带有用户特定意图的泊车车位输出。本发明引入文本信息表征用户特定的泊车意图，通过文本信息和图像信息的交互融合，为用户搜索到带有特定用户意图的最佳推荐车位。

技术关键词

文本特征提取模块多模态特征融合多视角图像解码结构意图泊车场景多通路混合模块多尺度特征值分辨率参数

系统为您推荐了相关专利信息

基于停车场车位状态监测的停车场管理系统及管理方法

停车场车位状态图像识别模型车位状态检测停车场管理方法停车场管理系统

一种轮胎断面结构优化方法

轮胎断面结构轮胎有限元模型二维有限元模型印痕轮胎结构设计

涵洞的检测方法及装置

涵洞图像检测模型图像处理技术处理器可读存储介质

一种基于智能决策的茶叶加工辅助方法及系统

跨模态环境监测数据设备运行数据时空融合特征多模态特征融合

一种芯片分选错位的处理方法、终端、装置及存储介质

错位晶圆芯片坐标身份

基于图像-文本融合增强的多模态泊车检测系统

站点导航

APP 下载