摘要
本发明公开了一种RGB‑T图像多模态语义分割方法及系统,该方法使用莫比乌斯变换替代传统线性变换,其中,采用双分支结构分别提取RGB‑T图像特征,每个分支均设有多个依次连接的莫比乌斯自注意力层;在特征融合层引入莫比乌斯交叉注意力融合层融合RGB‑T图像特征得到多尺度特征,接着空间解码器通过上采样操作对齐不同层级的多尺度特征的分辨率,再融合多个层级的多尺度特征后投影到类别空间,通过Softmax函数生成分割预测结果。本发明技术方案构建的莫比乌斯注意力机制能够在双曲空间中对多模态特征进行非线性映射,更有效地应对模态差异和边缘畸变,提升模型对多模态特征融合的适应性和融合精度。
技术关键词
红外图像特征
图像特征提取
Softmax函数
图像多模态
语义分割方法
分支
非线性
交叉注意力机制
多尺度特征
层级
多模态特征
嵌入特征
语义分割系统
符号
上采样
系统为您推荐了相关专利信息
点歌机
智能控制系统
面部图像数据
情感识别模型
多模态
边缘检测模型
多尺度信息
残差模块
输出特征
网络
聚类
图像特征向量
图像处理平台
图像处理方法
机器可读指令
直线传动机构
动力设备
图像特征提取算法
直线往复运动
芯杆