基于图像-文本融合增强的多模态泊车检测系统

AITNT
正文
推荐专利
基于图像-文本融合增强的多模态泊车检测系统
申请号:CN202411964800
申请日期:2024-12-30
公开号:CN119672678A
公开日期:2025-03-21
类型:发明专利
摘要
本发明公开了一种基于图像‑文本融合增强的多模态泊车检测系统,多视角摄像头输入图像信息,摄像头特征提取模块提取多视角摄像头图像特征,图像特征空间转换模块,将多视角摄像头图像融合至bev视角,实现多视角图像特征到bev特征的转换;输入文本模态信息,文本特征提取模块提取用户意图文本特征;多模态特征融合模块,获得文本特征和bev特征后,多模态特征通过多通路的特征融合模块进行充分交融;多模态decoder模块,基于transformer的解码结构,输出带有用户特定意图的泊车车位输出。本发明引入文本信息表征用户特定的泊车意图,通过文本信息和图像信息的交互融合,为用户搜索到带有特定用户意图的最佳推荐车位。
技术关键词
文本 特征提取模块 多模态特征融合 多视角 图像 解码结构 意图 泊车场景 多通路 混合模块 多尺度 特征值 分辨率 参数
系统为您推荐了相关专利信息
1
基于停车场车位状态监测的停车场管理系统及管理方法
停车场车位状态 图像识别模型 车位状态检测 停车场管理方法 停车场管理系统
2
一种轮胎断面结构优化方法
轮胎断面结构 轮胎有限元模型 二维有限元模型 印痕 轮胎结构设计
3
涵洞的检测方法及装置
涵洞 图像检测模型 图像处理技术 处理器 可读存储介质
4
一种基于智能决策的茶叶加工辅助方法及系统
跨模态 环境监测数据 设备运行数据 时空融合特征 多模态特征融合
5
一种芯片分选错位的处理方法、终端、装置及存储介质
错位 晶圆 芯片 坐标 身份
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号