摘要
本公开的实施例公开了一种文本数据引导的自解耦图像增量分割方法。该方法的一具体实施方式包括:针对背景设计正交初始化的多提示原型;通过构建类间关系图实施语言引导的原型—特征解耦,采用拓扑结构保持损失与局部最大相似损失从宏观与微观角度同时优化提示参数,结合跨模态相似得分蒸馏优化视觉特征提取器;通过新旧类视觉特征互解耦获取背景参考特征,利用监督对比学习实现背景—新类解耦;将解耦后的类别原型与密集视觉特征输入Transformer解码器,经背景特征融合及掩码操作生成分割结果,结合伪标签优化交叉熵损失;通过背景原型相似度自适应初始化新类提示前缀。该实施方式利用文本数据的泛化知识,实现了精确和稳定的图像增量分割。
技术关键词
图像块特征
原型
视觉特征提取
文本
编码器
图像分割
分割方法
模板
阶段
跨模态
标签
解码器
密集特征
蒸馏
样本
参数
数据
系统为您推荐了相关专利信息
编码器框架
通道注意力机制
人体关键点
特征金字塔
多层感知器
风险
定性分析方法
定性分析装置
大语言模型
方针
图像融合分类
高光谱图像数据
编码器
融合特征
融合多模态特征
专家抽取方法
学科知识图谱
专家数据库
项目特征
精度
社区划分方法
自动编码器
卷积神经网络融合
模块
融合策略