摘要
本发明属于跨模态图文检索技术领域,公开了基于内嵌稀疏门专家混合模型的图文跨模态检索方法,包括以下步骤:跨模态多尺度建模:利用空洞空间金字塔池化模块ASPP提取图像的多尺度图像特征,利用多尺度激活因子动态加权文本特征,实现图文跨模态多尺度语义对齐;多尺度跨模态特征融合:设计多尺度跨模态路由器,通过交叉注意力融合图像与文本特征,并通过专家网络分尺度提取跨模态联合特征;双路三元组损失计算:采用双路三元组损失函数,结合尺度内与跨尺度约束优化特征空间,实现多尺度与跨模态层面的联合优化,得到最终的跨模态检索结果。通过本发明提高跨模态图文检索的精度和效率。
技术关键词
三元组损失函数
空间金字塔池化
跨模态图文检索
文本
交互特征
图像多尺度
语义
模态特征
生成多尺度
空洞
交叉注意力机制
因子
路由器
系统为您推荐了相关专利信息
知识图谱补全方法
嵌入方法
大语言模型
实体
多层感知机