摘要
本发明提出了一种用于复杂交通路景图像的语义分割方法,包括以下步骤:首先进行数据集的预处理,然后采用Tr‑Net网络作为基础,该网络具备编码‑解码结构,其中编码器为双通路结构,分别对应上下文通路和空间通路。编码器的空间通路采用预训练的ResNet50网络,每通过两个残差块进行特征提取后,进行M‑AFB注意力融合,并与上下文通路的特征图进行融合。最后通过解码器上采样完成最终的图像语义分割动作。本发明中,Tr‑Net通过使用M‑ASMB多尺度空洞卷积块捕获更广泛的上下文信息,增加模型的感受野,M‑AFB通过区域注意力和像素注意力机制学习图像特征权重,进行特征融合。Tr‑Net的多尺度结构网络,有效地提升了模型语义分割的精准性和鲁棒性,以及算法效率。
技术关键词
多尺度网络
图像分割
编码器
解码器
上采样
注意力机制
空洞
交通
通路结构
解码结构
像素
图像语义分割
语义分割方法
金字塔池化
分辨率
结构网络
运动相机
系统为您推荐了相关专利信息
果园图像
采摘菠萝
果实
基础网络架构
作业机器人
素材推荐方法
语义向量
动态权重优化
图像
多角度
音频特征
输出特征
时域卷积网络
加权特征
语音特征