数据空间中语义与向量融合的跨模态检索方法

AITNT
正文
推荐专利
数据空间中语义与向量融合的跨模态检索方法
申请号:CN202510401702
申请日期:2025-04-01
公开号:CN120386902A
公开日期:2025-07-29
类型:发明专利
摘要
本发明提出了数据空间中语义与向量融合的跨模态检索方法,属于跨模态信息检索领域,首先收集并预处理多模态数据;利用预训练模型生成模态嵌入并存储;构建共享语义空间,通过对比学习优化跨模态向量对齐,设计模态映射网络增强嵌入投射效果;使用Milvus数据库存储对齐后的嵌入,构建HNSW索引;处理用户文本或图像查询,文本查询解析限定条件生成增强嵌入,图像查询通过OCR提取文字并与图像特征融合生成嵌入;在数据库中通过条件筛选与语义相似度计算,检索Top‑K候选项;对候选结果进行多模态相关性排序并返回结果;本发明构建共享语义空间,优化不同模态嵌入的对齐效果,进行多模态嵌入的高效存储与索引管理,实现大规模跨模态数据的实时检索。
技术关键词
模态检索方法 文本 预训练模型 图像 BERT模型 跨模态信息检索 音频 索引机制 融合多模态特征 自然语言 视频 检索系统 语义向量 跨模态数据 网络
系统为您推荐了相关专利信息
1
面向分布式大模型训练的多粒度语义树构建系统及其方法
构建系统 语义 云服务器 样本 标签
2
电杆质量确定方法、装置、设备、介质及程序产品
电杆 钢筋腐蚀状态 样本 计算机可执行指令 L1范数正则化
3
一种过鱼通道内动态鱼类的三维模型重构方法、装置、设备及介质
三维模型重构方法 深度图像数据 过鱼通道 三维重构模型 动态
4
一种超声波雷达pin针缺陷检测方法
深度学习框架 缺陷检测方法 边缘检测算法 坐标 轮廓区域
5
一种基于AVX指令的卷积加速方法、设备及介质
卷积加速方法 数据格式 可执行程序代码 异构计算系统 图像处理模型
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号