摘要
本发明公开了一种面向智能交通场景感知需求的RGB‑T图像语义解析方法,属于图像语义解析领域,包括:将热红外图像单通道与三通道可见光图像拼接,构建四通道RGB‑T输入图像;通过单分支编码器对所述四通道RGB‑T输入图像进行多级特征提取,生成多尺度编码特征;通过颈部网络对所述多尺度编码特征进行多尺度注意力增强与上下文融合,生成多尺度融合特征图;通过自适应门控解码器对所述多尺度融合特征图进行迭代解码,输出语义分割结果。本发明通过端到端训练,可在嵌入式平台上高效部署,满足实际场景中对精度与速度的综合需求。
技术关键词
图像语义解析方法
生成多尺度
面向智能交通
融合特征
编码特征
可见光图像
上下文特征
红外图像对比度
输出特征
编码器
空间金字塔池化
注意力
通道
解码器
分支
嵌入式平台
阶段
系统为您推荐了相关专利信息
影像
融合分类方法
多尺度特征融合
非线性
训练集
舰船检测方法
融合特征
子模块
颈部结构
输出特征
图像特征提取
图像生成模型
噪声特征
多模态
文本编码器
图像分类方法
预训练模型
卷积神经网络模块
文本编码器
标记
布料缺陷
卷积模块
卷积神经网络模型
分支
融合特征