摘要
本发明属于计算机视觉领域,提供了一种基于特征校准的边缘阈值的RGB‑D室内场景语义分割方法,其特征在于,该方法包括一下步骤:1)获取训练和测试该任务的RGB‑D数据集,并定义本发明的算法目标;2)利用深度学习技术,构建基于特征校准的边缘阈值并通过双编码器‑解码器结构构建RGB‑D语义分割网络模型;3)构建一个跨模态特征校准并实现边缘信息引导网络用于生成多模态特征;4)跨模态连接融合,再提取特征,增强多模态特征的高级语义信息;5)使用DeeplabV3+解码器,将编码器输出的特征图通过一系列的全连接层进行上采样和特征重建,并使用非线性激活函数(ReLU)增强模型的表达能力,最终得到与输入图像大小相同的分割结果Pest;6)预测的分割结果图Pest与人工标注的语义分割图PGT计算损失;7)对测试数据集进行测试,生成分割结果图Pest,并使用评价指标进行性能评估。
技术关键词
跨模态
语义分割方法
多模态特征
校准
双编码器
语义分割网络
解码器架构
解码器结构
深度学习技术
上采样
sigmoid函数
图像
语义分割算法
特征融合网络
融合特征
模块