摘要
本申请公开了一种基于全局与局部混合表示的零样本图像指代分割方法、装置、介质和设备,通过利用SAM生成一系列高质量无标签分割掩码,结合修改后的CLIP的图像编码器对每个分割掩码进行混合全局‑局部特征以理解每个分割掩码的上下文信息,再加入一个空间引导增强模块进行空间关系校正,最后通过相似度打分来实现指代分割,实现了SAM和CLIP在指代分割任务中全部潜力的释放,并且能够具有空间关系理解的能力。
技术关键词
分割方法
文本编码器
语义
分支
空间位置关系
样本
校正
注意力
矩阵
输入输出单元
图像编码器
图像处理模块
存储计算机程序
特征提取模块
系统为您推荐了相关专利信息
网站检测方法
大语言模型
无监督
非暂态计算机可读存储介质
资源定位系统
语义
语句
信息搜索方法
计算机设备
计算机存储介质
语义分割模型
分类网络
标签
弱监督语义分割
生成超像素
智能喷嘴
三维点云数据
三维成像
曲面
三维网格模型