文本引导的参数高效微调图像分割与计数模型及计数方法

正文

推荐专利

申请号：CN202510103092

申请日期：2025-01-22

公开号：CN120014396A

公开日期：2025-05-16

类型：发明专利

摘要

本发明公开了一种文本引导的参数高效微调图像分割与计数模型及计数方法，所述模型包括预训练的视觉语言大模型CLIP、最大连通区域和非极大值抑制模块以及预训练的分割模型SAM，其中：所述预训练的视觉语言大模型CLIP包括预训练的CLIP图像编码器以及标准文本编码器；所述预训练的分割模型SAM包括SAM编码器、提示编码器和掩码解码器，所述预训练的分割模型SAM还集成了轻量级适配器和CLIP特征融合与掩码生成模块，所述轻量级适配器用于调整SAM编码器，所述CLIP特征融合与掩码生成模块用于将CLIP图像编码器生成的图像特征FC迁移与融合至掩码解码器中，并指导掩码解码器生成高质量的分割掩码。本发明的模型具有强大的泛化性能和较高的计数准确性。

技术关键词

图像分割图像编码器文本编码器计数方法适配器冗余特征融合图像特征解码器注意力微调方法模块令牌生成图像特征视觉参数多层感知机对象

系统为您推荐了相关专利信息

基于机器视觉的钟表走时准确性自动化检测方法

自动化检测方法钟表静态误差图像分割技术指数

一种基于图像处理的铜、铝基材焊接控制方法及系统

多模态焊接控制方法铜铝基材图像处理

一种基于视觉语言大模型的文本审查方法及系统

视觉词汇表图像编码器身份验证机制积层服务器

一种基于ResUnet++模型的光学影像图像分割方法

图像分割方法影像三通道标签文件多通道

一种电力无人机拍摄航点自动规划系统

自动规划系统电力无人机智能识别模块机器学习分类模型数据传输模块

文本引导的参数高效微调图像分割与计数模型及计数方法

站点导航

APP 下载