摘要
本公开涉及图像处理技术领域,提供了一种多模态图像检索方法、装置、电子设备及可读存储介质。该方法包括:获取待检索对象的图像信息和文本信息;基于图像信息确定图像嵌入特征,基于文本信息确定文本嵌入特征,并将图像信息输入至预设多模态编码器,得到用于描述图像信息的图像描述特征;基于图像嵌入特征、文本嵌入特征和图像描述特征,得到综合特征;通过预设文本编码器处理综合特征,得到目标特征;获取目标图像库中各目标图像对应的待匹配图像特征,基于待匹配图像特征和目标特征确定待检索对象的目标检索结果。通过本公开提供的方法,提升了图像检索的精度和泛化能力。
技术关键词
嵌入特征
图像嵌入
检索对象
融合特征
文本编码器
查询机制
多层感知器
多模态
铰链
图像检索装置
图像编码器
电子设备
可读存储介质
图像处理技术
处理器
模块
系统为您推荐了相关专利信息
标记医学图像
医学图像分割模型
医学图像分割方法
解码器
分割医学图像
评估电池健康状态
锂离子电池健康状态
数据
皮尔逊相关系数
粒子群优化算法
重建点云
多模态数据融合
船舶
融合特征
泊松圆盘采样