摘要
本申请涉及一种基于视觉文本引导的少标注遥感图像语义分割方法和装置,包括利用视觉文本模型的视觉特征编码器处理图像数据,得到视觉编码特征,利用视觉文本先验解耦模型分别处理支撑图像编码特征和查询图像编码特征,得到支撑图像视觉文本先验和查询图像视觉文本先验,利用高置信视觉特征模型得到混合后的多层级支撑图像编码特征;利用多层级先验计算模型得到视觉关系先验值,利用多层级先验解码网络对先验进行解码,得到所述输入的图像的分割结果,本申请在遥感影像小样本语义分割中引入视觉文本先验,利用视觉文本模型的通用性缓解了小样本语义分割中遥感影像类内差异大的问题。
技术关键词
图像编码
层级
图像视觉特征
文本
语义分割模型
解码网络
原型
标签
遥感图像语义分割
编码特征
数据
编码器
混合模块
分辨率
系统为您推荐了相关专利信息
大语言模型
推理系统
生成文本内容
图谱
推理方法
地理位置信息
地理信息系统
社会
处理器模块
多轮对话
图像处理方法
实体
图像生成模型
关系
大语言模型