基于图片映射器和文本自遮掩映射器的组合图像检索方法

正文

推荐专利

申请号：CN202411438579

申请日期：2024-10-15

公开号：CN119441514B

公开日期：2025-11-18

类型：发明专利

摘要

基于图片映射器和文本自遮掩映射器的组合图像检索方法，包括：先对输入的图片进行缩放加噪等操作，然后输入到冻结的预训练图像编码器中，得到图像特征利用图像映射器将图像特征转化成伪词标记s1,利用文本自遮掩映射器将图像特征转化成伪词标记s2，分别将其替换预先提供的提示文本中的标记符号，并将输入的修改文本拼接到提示文本之后，得到两个新的文本x1，x2。将文本x1，x2分别输入到冻结的预训练文本编码器中，得到两个特征，将两个特征进行均值融合，最后将得到的均值特征与目标图像进行对比。本发明既解决了使用昂贵三元组训练组合图像检索模型的缺点，也提高了模型对组合图像检索下游任务的泛化能力。

技术关键词

图像检索方法图片文本编码器关键词梯度下降算法标记自然语言图像检索模型传播算法符号噪声图像编码器关键字列表网络表达式融合特征数据

系统为您推荐了相关专利信息

前后向安全的非交互公开可验证对称可搜索加密方法

密文数据库服务端客户端加密算法索引

基于细粒度图文语义对齐的鲁棒性增强训练方法与系统

文本编码器样本视觉特征图文鲁棒性

一种基于3D人脸识别的智能门锁开启方法及系统

智能门锁开启方法人脸特征模型人脸识别信息开锁机制场景

测天文光红移的标准数据集和基线模型的构建方法和系统

贝叶斯神经网络基线小区间样本神经网络模型训练

基于软提示的中文文本嵌套命名实体识别方法

中文文本跨度注意力机制双向长短期记忆网络命名实体识别模型

基于图片映射器和文本自遮掩映射器的组合图像检索方法

站点导航

APP 下载