一种基于视觉大模型多尺度提示的小样本语义分割方法

正文

推荐专利

申请号：CN202510113896

申请日期：2025-01-24

公开号：CN120107579B

公开日期：2025-12-09

类型：发明专利

摘要

本发明公开了一种基于视觉大模型多尺度提示的小样本语义分割方法，步骤如下：构建同类的支持查询样本对；获取支持融合特征、查询融合特征和查询图像的视觉先验对支持融合特征和查询融合特征进行建模及下采样，提取多尺度的支持特征和查询特征；利用多尺度的支持特征和查询特征生成多尺度的提示编码和生成目标提示编码；将目标提示编码和查询图像输入到提示型视觉大模型中，获取查询图像的分割结果；将小样本数据中的支持查询样本对输入经训练的预测模型，对查询图像进行分割，根据预测结果计算分割准确率。与现有方法相比，本发明能充分利用多尺度下的语义信息，生成的提示信息更加准确，在多种场景下能够进一步提升小样本语义分割任务的精度。

技术关键词

语义分割方法查询特征融合特征提取注意力视觉多尺度特征提取双线性插值掩膜样本金字塔特征图像编码生成多尺度构建预测模型矩阵多尺度特征金字塔解码器

系统为您推荐了相关专利信息

智能化固体废弃物环保处理系统及方法

渗滤液编码向量垃圾时序 pH值

一种大模型间接提示注入防御方法及相关装置

注意力分布特征检测器样本分类器

基于三维数字模型与图像增强技术的机场语义分割方法

三维数字模型图像增强技术语义分割方法定义感兴趣区域三维模型

文档分类方法及文档分类装置

文档分类方法语义特征文本段落视觉文档分类装置

扫地机器人及其语音交互方法和装置、存储介质

语音交互方法多模态语义语音交互装置文本特征向量

一种基于视觉大模型多尺度提示的小样本语义分割方法

站点导航

APP 下载