一种用于多模态语义分割的混合提示架构融合方法

正文

推荐专利

申请号：CN202510549133

申请日期：2025-04-28

公开号：CN120599417A

公开日期：2025-09-05

类型：发明专利

摘要

一种用于多模态语义分割的混合提示架构融合方法，属于计算机视觉领域。本发明实现方法为：基于RGB预训练模型构建多模态嵌入模块；对于多模态嵌入模块输出的初始提示和主干网络输入的RGB特征，使用线性映射投影到低秩子空间完成特征对齐，引入混合矩阵将低秩子空间的RGB特征与提示信息融合，新的提示信息与主干网络编码的RGB特征融合；引入轻量化的多子空间对齐和混合提示模块；使用主干网络的多分辨率自注意力编码器编码RGB图像特征，辅助图像信息通过多模态嵌入模块生成初始提示，初始提示信息与RGB图像特征通过多子空间对齐与混合提示模块融合形成新的提示信息与RGB图像特征融合，融合RGB图像与辅助模态的语义信息。

技术关键词

架构融合方法多模态混合矩阵语义模态特征图像注意力编码器表达式分辨率采样模块提示生成方法线性网络架构多层级特征融合特征多层感知器

系统为您推荐了相关专利信息

SQL语句修改冲突预测方法、装置、设备及存储介质

语句语义特征融合特征冲突预测方法注意力机制

文本处理方法、装置、电子设备、介质和程序产品

句法结构文本处理方法训练语言模型语义角色标注文本处理装置

一种融合脑血管形态学与功能学的个体化脑血流模拟方法

多模态医学影像形态学特征血流模拟系统模拟程序图谱

智能群体决策方法及系统、电子设备、存储介质

群体决策方法多模态可穿戴设备池化算法音视频

一种可算传权衡的图像语义通信系统资源分配方法

切片终端信道解码器信道编码器时延

一种用于多模态语义分割的混合提示架构融合方法

站点导航

APP 下载