一种基于多模态融合的互动式图像检索方法

正文

推荐专利

一种基于多模态融合的互动式图像检索方法

申请号：CN202411679586

申请日期：2024-11-22

公开号：CN119622013B

公开日期：2025-10-31

类型：发明专利

摘要

本发明属于图像检索领域，具体涉及一种基于多模态融合的互动式图像检索方法；包括：采用深度神经网络模型对文本、素描和图像进行编码，得到文本嵌入向量、素描嵌入向量和图像嵌入向量；融合文本嵌入向量和素描嵌入向量，得到融合嵌入向量；根据图像嵌入向量和融合嵌入向量构建奖励函数；构建包含奖励函数的强化学习模型并训练，当达到预设的训练次数时，完成模型训练；实时获取用户的素描以及用户对检索对象的文本描述，将素描和文本输入到训练好的强化学习模型中进行实时检索，模型反馈给用户检索到的图像；用户根据反馈图像进一步优化素描，直至检索到用户满意的目标图像；本发明可保证检索反馈的稳定性能，实现了更优质的检索体验。

技术关键词

多模态特征融合图像嵌入强化学习模型深度神经网络模型图像检索方法检索对象文本编码器图像编码器分支误差基础数据

系统为您推荐了相关专利信息

融合深度聚类和Transformer模型的智能决策方法及系统

智能决策方法非线性编码聚类算法注意力机制

一种隐私保护的深度语音数字水印流式嵌入与检测方法

深度神经网络模型音频水印脱敏数据通信网络水印检测

融合注意力机制的可变卷积UNet牙齿图像分割方法及系统

牙齿图像分割方法融合注意力机制多模态特征融合编码特征协同注意力

基于局部敏感哈希和深度学习筛选的双重验证型图像检索方法

局部敏感哈希云服务提供商解密图像图像检索方法加密

服务器配置的优化方法、装置、存储介质及电子设备

强化学习模型服务器集群数据策略样本

一种基于多模态融合的互动式图像检索方法

站点导航

APP 下载