一种用于多模态语义分割的混合提示架构融合方法

AITNT
正文
推荐专利
一种用于多模态语义分割的混合提示架构融合方法
申请号:CN202510549133
申请日期:2025-04-28
公开号:CN120599417A
公开日期:2025-09-05
类型:发明专利
摘要
一种用于多模态语义分割的混合提示架构融合方法,属于计算机视觉领域。本发明实现方法为:基于RGB预训练模型构建多模态嵌入模块;对于多模态嵌入模块输出的初始提示和主干网络输入的RGB特征,使用线性映射投影到低秩子空间完成特征对齐,引入混合矩阵将低秩子空间的RGB特征与提示信息融合,新的提示信息与主干网络编码的RGB特征融合;引入轻量化的多子空间对齐和混合提示模块;使用主干网络的多分辨率自注意力编码器编码RGB图像特征,辅助图像信息通过多模态嵌入模块生成初始提示,初始提示信息与RGB图像特征通过多子空间对齐与混合提示模块融合形成新的提示信息与RGB图像特征融合,融合RGB图像与辅助模态的语义信息。
技术关键词
架构融合方法 多模态 混合矩阵 语义 模态特征 图像 注意力编码器 表达式 分辨率 采样模块 提示生成方法 线性 网络架构 多层级特征 融合特征 多层感知器
系统为您推荐了相关专利信息
1
SQL语句修改冲突预测方法、装置、设备及存储介质
语句 语义特征 融合特征 冲突预测方法 注意力机制
2
文本处理方法、装置、电子设备、介质和程序产品
句法结构 文本处理方法 训练语言模型 语义角色标注 文本处理装置
3
一种融合脑血管形态学与功能学的个体化脑血流模拟方法
多模态医学影像 形态学特征 血流模拟系统 模拟程序 图谱
4
智能群体决策方法及系统、电子设备、存储介质
群体决策方法 多模态 可穿戴设备 池化算法 音视频
5
一种可算传权衡的图像语义通信系统资源分配方法
切片 终端 信道解码器 信道编码器 时延
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号