摘要
本发明公开了一种基于多级交互的无监督跨模态哈希检索方法,属于跨模态哈希检索技术领域,主要包括以下步骤:跨模态数据预处理;构建基于多级交互的无监督跨模态哈希检索网络;网络训练:将图像‑文本训练样本分批次输入到构建的网络中进行网络训练;模态检索:将图像‑文本的查询样本集和检索样本集输入训练完成的基于多级交互的无监督跨模态哈希检索网络中,分别生成对应的哈希码,通过计算查询样本和检索样本哈希码间的汉明距离得到查询结果,汉明距离最小者即为最终的查询结果。本发明能将高维的多模态特征压缩为紧致的二进制码,显著提升了跨模态检索效率,可用于实时图像搜索和跨模态推荐系统。
技术关键词
文本
汉明距离
随机梯度下降
模块
非暂态计算机可读存储介质
重构误差
语义
注意力机制
跨模态数据
图像特征提取
特征提取网络
处理器
特征提取器
检索技术
训练样本集
系统为您推荐了相关专利信息
开关模块
存储器阵列
位线
SRAM存储单元
读出电路
聋哑人手语
动态手语识别
静态手语
时空融合特征
识别方法
数字孪生系统
全息环境
全生命周期管理系统
区块链存证
海洋工程