基于模态协同视觉语言大模型分层剪枝的图像分割方法

正文

推荐专利

申请号：CN202411735285

申请日期：2024-11-29

公开号：CN119762962B

公开日期：2025-10-10

类型：发明专利

摘要

本发明公开了基于模态协同视觉语言大模型分层剪枝的图像分割方法，包括以下步骤：获取遥感图像；将每个块中的编码视觉信息转换为具有语言信息的视觉表示；基于每个块的输出，将不同模态中功能相似的层进行分组；引入KL散度作为辅助目标支持参数重要性估计；计算模态协同重要性分数；计算每个权重的稀疏度；找到能最大限度保持模型性能的最优稀疏权重；根据层稀疏度执行视觉语言大模型的逐层剪枝；剪枝后的视觉语言大模型进行图像分割，并输出图像分割结果。本申请构建来自不同模态的VLM层之间的跨模态依赖关系，基于全局跨模态信息的逐层剪枝；利用原始模型的软目标，能够从原始模型中获益并保留其行为特性。

技术关键词

图像分割方法视觉分层语言编码器多视角校准参数模型压缩数据注意力模型块跨模态样本矩阵标签标记代表

系统为您推荐了相关专利信息

一种基于实时深度估计的图像视觉伺服螺栓对准方法

对准方法坐标系奇异值分解重构相机雅克比矩阵

一种气旋强度预测方法及装置

热带气旋强度卫星云图深度卷积神经网络强度预测方法因子

黄皮保鲜方法及系统

黄皮保鲜方法中央控制单元通信稳定剂冰水浓度传感器

一种基于距离正则化项和局部特征增强的混合水平集图像分割方法

混合水平集图像分割方法 canny算子像素点高斯核函数

一种基于CCD相机的高精度多视角图像识别检测方法

图像识别检测方法多视角 CCD相机语义分割网络感知特征

基于模态协同视觉语言大模型分层剪枝的图像分割方法

站点导航

APP 下载