摘要
本发明公开了一种基于视觉大模型多尺度提示的小样本语义分割方法,步骤如下:构建同类的支持查询样本对;获取支持融合特征、查询融合特征和查询图像的视觉先验对支持融合特征和查询融合特征进行建模及下采样,提取多尺度的支持特征和查询特征;利用多尺度的支持特征和查询特征生成多尺度的提示编码和生成目标提示编码;将目标提示编码和查询图像输入到提示型视觉大模型中,获取查询图像的分割结果;将小样本数据中的支持查询样本对输入经训练的预测模型,对查询图像进行分割,根据预测结果计算分割准确率。与现有方法相比,本发明能充分利用多尺度下的语义信息,生成的提示信息更加准确,在多种场景下能够进一步提升小样本语义分割任务的精度。
技术关键词
语义分割方法
查询特征
融合特征提取
注意力
视觉
多尺度特征提取
双线性插值
掩膜
样本
金字塔特征
图像编码
生成多尺度
构建预测模型
矩阵
多尺度特征金字塔
解码器
系统为您推荐了相关专利信息
三维数字模型
图像增强技术
语义分割方法
定义感兴趣区域
三维模型
文档分类方法
语义特征
文本段落
视觉
文档分类装置
语音交互方法
多模态
语义
语音交互装置
文本特征向量