摘要
本申请公开一种目标检索方法和系统。其方法包括:步骤S1:数据接入与预处理,包括获取多源数据,进行清洗、格式化、时空标准化,并对图像/视频进行目标检测和裁剪,生成结构化目标对象;步骤S2:特征提取,包括从目标图像中提取具有判别性和适应复杂场景的深层语义特征向量以及辅助理解信息;步骤S3:构建数据索引,包括基于目标的深层特征和时空信息,构建多类型节点和超边的时空语义超图索引,用以表达目标间的复杂关系;步骤S4:数据查询,包括接收用户多模态查询信息,利用超图索引进行候选区域筛选、特征匹配和关系推理,最终输出高置信度的目标检索结果。本申请提高了复杂场景和目标变化的鲁棒性以及深度的多维度查询。
技术关键词
检索方法
特征提取模型
语义
索引
顶点
特征提取模块
数据
层级
子模块
格式化
多模态
协同注意力
动态
关系
查询意图
图像
场景
对象
基础结构
系统为您推荐了相关专利信息
语义匹配算法
目录
训练语言模型
文档内容结构化
主题模型