摘要
本发明公开了一种全局语义引导的跨模态哈希检索方法。属于多媒体检索的跨模态检索技术领域。本发明首先构建基于标签的模态特定特征增强模块,通过三个损失函数对齐图像特征、文本特征与标签特征,从而挖掘一致的多源语义关联。其次,建立全局语义结构捕捉模块,以捕捉样本间的全局语义结构关系,并生成精炼的全局语义增强跨模态一致性特征。最后,将这些跨模态一致性特征与模态特定特征相融合,并使用全局语义结构关系指导对比哈希学习,以优化哈希网络。本发明不仅能够有效探索不同模态数据间的一致性信息,还能准确捕获样本间的全局语义结构关系,因此产生的哈希表示具备出色的辨识能力。
技术关键词
哈希检索方法
语义结构
文本
跨模态
标签特征
样本
图像
查询特征
矩阵
卷积神经网
哈希方法
关系
数据
检索技术
多层感知机
键特征
算法
注意力机制
系统为您推荐了相关专利信息
深度学习模型
约简方法
序列
样本
命名实体识别模型