摘要
本发明提供一种基于图像块敏感代理注意力网络的开放词汇语义分割方法,包括下列步骤:构建基于图像块敏感代理注意力网络,包括文本编码器、两个图像编码器,其中,两个图像编码器分别是经过预训练的CLIP图像编码器和视觉基础模型VFM编码器;对于给定的图像,给出对应图像的语义标注信息,包括物体所属的具体类别和物体掩码的Ground Truth图,利用骨干网的CLIP图像编码器和视觉基础模型VFM编码器分别提取图像特征;图像块敏感的代理注意力处理;图像块自适应归一化处理;掩码处理得到注意力图;图像分割。
技术关键词
图像编码器
语义分割方法
注意力
图像块
文本编码器
图像分割
归一化模块
视觉
网络
物体
基础
参数
系统为您推荐了相关专利信息
冲突检测方法
冲突检测系统
分段
信息数据处理终端
多径效应
位姿估计方法
关键点
特征提取网络
通道注意力机制
协方差矩阵
数据分类方法
融合特征
多标签
分类特征
卷积特征