摘要
本发明属于车联网数据管理技术领域,具体涉及一种面向车联网的海量多模数据检索方法,包括以下步骤:通过CLIP模型的视觉编码器和文本编码器,从目标数据的车牌图像Xr、描述文本Tm中分别提取图像特征和文本特征;通过PCA算法对图像特征进行降维;将得到的文本特征和降维后的图像特征进行拼接,得到图像文本联合特征;通过MM‑VAE模型对图像文本联合特征进行压缩,得到压缩特征;计算查询特征与各个目标数据压缩特征之间的余弦相似度,找到最匹配的目标数据。本发明的检索方法能够高效地压缩多模态数据特征,并在统一的潜在空间中进行融合,显著提升了检索的准确性与效率。
技术关键词
数据检索方法
面向车联网
压缩特征
查询特征
PCA算法
文本编码器
数据压缩
数据管理技术
图像嵌入
车牌
优化器
多模态
因子
参数
系统为您推荐了相关专利信息
连续学习方法
查询特征
适配器
微调技术
大语言模型
图像嵌入
图像检索方法
图像检索模型
查询特征
文本编码器
智能提取方法
岩体结构面
三维点云数据
三维点云模型
多视角
图像增强模型
图像增强方法
视频帧
对齐模块
图像输出模块
高光谱图像数据
样本分类方法
数据立方体
邻域
样本分类系统