摘要
本发明涉及自动驾驶语义分割领域,具体涉及一种基于空间内容特征交叉融合的城市街景图像语义分割方法。方法包括:搭建改进Segmenter模型,并训练,得到训练好的改进Segmenter模型;利用训练好的改进Segmenter模型,对城市街景图像进行语义分割;其中,改进Segmenter模型在包括主干部分、空间分支和内容分支和掩模解码器;主干部分为ViT模型的backbone,用于提取输入图像的基本特征;空间分支用于利用主干部分每个编码器层的查询Q实现空间特征增强;内容分支用于收集主干部分每个编码器层的特征融合多层次的特征,并提取多尺度特征。本发明改进空间细节的提取并聚合了多阶段上下文信息,有效地整合不同尺度和级别的特征,提高自动驾驶应用中处理复杂城市语义分割任务的有效性和效率。
技术关键词
多尺度特征
编码器
分支
多层次
图像语义分割装置
解码器
注意力
街景
sigmoid函数
掩模
上下文特征
上采样
存储计算机程序
搭建模块
计算机程序产品
处理器
输出特征
系统为您推荐了相关专利信息
意图
推荐方法
推荐模型训练
智慧城市推荐技术
会话
训练图像序列
令牌
合并单元
转换器模块
视频分类方法