摘要
本发明提出了数据空间中语义与向量融合的跨模态检索方法,属于跨模态信息检索领域,首先收集并预处理多模态数据;利用预训练模型生成模态嵌入并存储;构建共享语义空间,通过对比学习优化跨模态向量对齐,设计模态映射网络增强嵌入投射效果;使用Milvus数据库存储对齐后的嵌入,构建HNSW索引;处理用户文本或图像查询,文本查询解析限定条件生成增强嵌入,图像查询通过OCR提取文字并与图像特征融合生成嵌入;在数据库中通过条件筛选与语义相似度计算,检索Top‑K候选项;对候选结果进行多模态相关性排序并返回结果;本发明构建共享语义空间,优化不同模态嵌入的对齐效果,进行多模态嵌入的高效存储与索引管理,实现大规模跨模态数据的实时检索。
技术关键词
模态检索方法
文本
预训练模型
图像
BERT模型
跨模态信息检索
音频
索引机制
融合多模态特征
自然语言
视频
检索系统
语义向量
跨模态数据
网络
系统为您推荐了相关专利信息
电杆
钢筋腐蚀状态
样本
计算机可执行指令
L1范数正则化
三维模型重构方法
深度图像数据
过鱼通道
三维重构模型
动态
深度学习框架
缺陷检测方法
边缘检测算法
坐标
轮廓区域
卷积加速方法
数据格式
可执行程序代码
异构计算系统
图像处理模型