摘要
本发明公开了基于空间聚类和重建技术的高分辨率图像分割方法,具体包括S1、构建出token序列;S2、初始化聚类中心,迭代计算更新聚类中心,直到中心位置收敛;S3、抽取图像特征;S4、重建非参数化的特征;S5、选择预测标签:上采样与特征融合后的特征传递给分割头生成每个像素的类别预测,选择概率最高的类别作为每个像素的预测标签;本发明在已有的ViT模型的基础上添加非参数化的token聚类层和重建层,实现ViT的输入从高分辨率图像转移到低分辨率特征,不需要进行大量的人工像素级标注最后重建高分辨率特征的路径,从而在保持预测性能的同时大幅提升推理速度,最终将融合后的特征传递给分割头,生成每个像素的类别预测。
技术关键词
高分辨率图像分割
重建技术
特征提取网络
聚类
编码器
像素
代表
参数
图像块
多尺度特征融合
上采样
高维特征向量
图像分割方法
深度编码
标签
序列
关系
语义特征
系统为您推荐了相关专利信息
交通拥堵预测方法
多源特征融合
数据嵌入
注意力
输出特征
语义向量
语义标签
轮廓特征
场景特征
三维点云数据
矩阵
心脏
标签类别
视觉特征
计算机可读存储设备
图像处理模型
噪声数据
样本
模型训练方法
解码器