摘要
本申请提供一种基于大数据的图文检索方法及系统,获取待检索的图文模态数据;分别对图像模态数据和文本模态数据进行特征提取,得到对应的图像特征表示和文本特征表示,通过图像特征表示和文本特征表示确定图文模态融合熵;依据图文模态融合熵确定文本描述阵列和图像描述阵列,根据文本描述阵列和图像描述阵列进行注意转换,进而得到二维模态空间下的局部图文融合特征和全局图文融合特征;对局部图文融合特征和全局图文融合特征进行拼接,得到图像模态信息和文本模态信息之间的融合模态表示,基于融合模态表示进行图文检索。采用上述方案可以将图像模态信息和文本模态信息进行模态融合,以提高图文检索时的检索性能。
技术关键词
融合特征
图文检索方法
文本特征向量
图像特征向量
阵列
局部图像特征
注意力
大数据
计算机设备
检索系统
可读存储介质
深度学习模型
存储计算机程序
存储器
模块