摘要
本发明公开了基于多视角中心结构的多模态哈希检索方法、系统、设备及介质,属于人工智能及多模态哈希检索技术领域,本发明要解决的技术问题为多模态哈希检索过程中类内紧凑性和类间可分性之间取得平衡,采用的技术方案为:构建多模态数据集;构建基于多视角中心结构的多模态哈希检索模型;训练模型;其中,构建基于多视角中心结构的多模态哈希检索模型具体如下:模态特定原型学习:利用图像模态深度多层感知器和文本模态深度多层感知器分别从对应模态中提取细化特征,并计算图像模态和文本模态细化特征的平均值获取模态特定原型,进而获取图像模态的独特特征和文本模态的独特特征;多模态集成类原型学习;多视角语义增强哈希学习。
技术关键词
原型
哈希检索方法
多视角
文本
多层感知器
损失函数优化
多模态
预训练模型
深度特征提取
样本
语义
矩阵
数据
模态特征
构建训练集
深度学习技术
邻域
图像深度特征
Adam算法
系统为您推荐了相关专利信息
多源异构数据处理
关键词
数据分类
电商
画像特征
语义分割方法
实例分割
卷积模块
融合特征
关键点