摘要
本发明属于多媒体信息检索技术领域,具体涉及一种基于自适应提示与隐式知识增强的跨媒体检索方法及系统。其包括以下步骤:步骤S100,建立跨媒体检索数据集,所述跨媒体检索数据集包括两种不同媒体类型的数据;步骤S200,利用所述跨媒体检索数据集训练基于自适应提示与隐式知识增强的跨媒体检索网络,所述跨媒体检索网络包括潜能激发机制以及基于实例级查询的提示池机制;步骤S300,利用训练完成的所述跨媒体检索网络进行跨媒体检索测试,实现不同媒体之间的匹配。本发明通过潜能激发机制和基于实例级查询的提示池机制,能够灵活应对媒体间信息的不对称性以及图像分布多样性造成的对齐误差,从而显著提升跨媒体检索的准确性和鲁棒性。
技术关键词
跨媒体检索方法
图像编码器
跨媒体数据
多角度
多媒体信息检索技术
机制
跨媒体检索系统
图像全局信息
多模态
视角
文本编码器
实体
图像嵌入
视觉特征
网络结构
系统为您推荐了相关专利信息
图像数据处理模块
多模态图像数据
可视化装置
正畸治疗
交互屏幕
合成孔径声呐
图像
三维点云模型
分割算法
多通道特征