摘要
本发明属于零样本草图检索技术领域,公开了一种基于掩码与匹配的零样本草图检索方法,首先,设计一种视觉‑跨语言采样器,该模块利用语义标签生成掩码,屏蔽图像中与草图目标无关的语义信息,优化跨域匹配的语义对齐效果。然后,设计了净化掩码匹配模块,包括特征重构和语义交互两部分,通过迫使图像编码器重建掩盖特征来抑制冗余语义,利用变换器解码器促进草图和图像特征之间的跨域交互,从而实现更精细的语义匹配。最后,结合三元组损失、重构损失和交互损失的训练机制,使得模型能够在净化后的语义空间中显著提升检索准确率。该方法通过掩码掩盖图像中的干扰元素并实现纯净的草图‑图像匹配,从而有效解决草图与自然图像之间的语义差异问题。
技术关键词
草图检索方法
图像编码器
重构
语义标签
三元组
样本
文本编码器
匹配模块
解码器
交叉注意力机制
数学
编码器架构
采样器
双编码器
检索技术
变换器
冗余
系统为您推荐了相关专利信息
图像编码器
加权损失函数
模型训练方法
连续特征
标签编码器
知识图谱构建
知识图谱补全
补全方法
三元组
海洋
大语言模型
决策优化方法
语义标签
动态预警方法
深度语义分析