摘要
本发明公开的一种基于轻量级双流Mamba网络的水下图像语义分割方法、设备及存储介质,涉及水下图像处理技术领域,解决现有水下图像语义分割技术存在环境适应性差、模态融合低效、模型沉重以及计算开销大的问题的问题,本发明通过构建双分支编码器,采用图像编码器和文本编码器组成的双分支编码器,分别提取预处理后的水下图像和文本描述信息中的视觉特征图和语义特征向量;采用跨模态Mamba模块将展平后的图像特征序列与文本特征在此模块中进行深度融合,跨模态Mamba模块采用线性复杂度的Mamba块,结合多层次门控融合机制和残差连接,实现文本语义的持续引导和渐进式增强,显著提升水下模糊、遮挡目标的识别能力的同时显著提高计算效率。
技术关键词
图像语义分割方法
视觉特征
文本编码器
跨模态
图像编码器
双线性插值
文本特征向量
网络
水下图像处理技术
图像语义分割技术
上采样
序列
多层感知机
水下图像数据
多层次
输出特征
融合特征
系统为您推荐了相关专利信息
配网带电作业
知识检索方法
知识检索系统
跨模态
矩阵