摘要
本发明公开了一种适应像素级大尺度无监督语义分割任务的分割方法、装置及存储介质,将待分割图像作为CLIPS的输入,进行文本‑图像匹配以判定图像存在的类别语义;在类别语义的指导下,利用检测模型对各类别所在的区域进行检测,得到几何框提示;将几何框提示作为SAM的输入,对待分割图像逐像素分配语义标签,得到语义分割结果。本发明利用基础模型强大的零样本泛化能力,并将当前域的知识嵌入到基础模型SAM的框提示中,实现了SAM的提示自动化,并大幅提高了大尺度无监督语义分割任务性能表现。
技术关键词
分割方法
无监督
图像编码器
分支
像素
语义标签
图像匹配
文本编码器
计算机装置
计算机程序产品
处理器
样本
邻居
掩模
核心
指令
可读存储介质
系统为您推荐了相关专利信息
霉菌检测方法
特征提取模型
数据
多模态
可见光图像
机器学习模型
价值评估方法
海洋生态系统
canny算法
气候
快速检测方法
瞬态故障
直流充电桩
功率器件
充电桩故障