摘要
本发明提供一种基于特征协同与多尺度特征融合的RGB‑D语义分割方法,属于计算机视觉和计算机图形学领域。该方法基于编码器‑解码器的网络结构对图像进行语义分割预测,在网络的每个阶段利用多种注意力机制实现多模态特征校正与融合,优化和增强输入数据的特征表示,并在解码器中使用自顶向下多尺度特征融合策略。通过多种注意力机制,模型能够有效捕捉全局特征与局部特征,实现同一尺度下不同模态信息的融合,并促进不同尺度下特征的精细聚合。本发明应用多种注意力机制实现多模态特征的协同与多尺度特征的融合,有效解决了RGB和深度信息之间的差异、数据中的噪声干扰,以及网络提取过程中细节信息的丢失问题。
技术关键词
语义分割方法
多尺度特征融合
交叉注意力机制
融合特征
解码器
通道注意力机制
双分支网络
多模态特征
融合策略
多尺度特征提取
计算机图形学
校正特征
特征提取模块
阶段
计算机视觉
系统为您推荐了相关专利信息
辅助验证方法
阈值分割方法
图像阈值分割算法
掩膜
生成对抗网络模型
状态空间模型
交互特征
图像特征信息
动态
注意力机制
分布式供电设备
故障预警系统
分布式电力
异常事件
故障特征
异物检测算法
地铁安全门
异物探测系统
多尺度特征融合
异物探测方法
点云语义分割方法
语义分割模型
文本
词嵌入模型
交叉注意力机制