摘要
基于多尺度线性注意力与U型结构的图像语义分割方法,属于图像分割和深度学习技术领域,包括将图片输入到编码器中,采用卷积stem进行局部信息提取;构建编码器,采用金字塔结构跨四个阶段使用Transformer Block计算多尺度特征;构建解码器,包括四个阶段,使用跳跃连接合并编码器和解码器每个阶段的特征;将解码器的第四阶段输出进行上采样操作,将分辨率恢复为输入分辨率,并使用线性层将特征图转换为分割掩码。本发明将多尺度线性注意力机制技术整合到U行编码器解码器架构中,这种集成不仅降低了计算成本,还提高了感受野交互和分割精度。在解码器中,采用CARAFE层进行上采样,有助于保留复杂的细节并提高器官边缘分割的精度。
技术关键词
图像语义分割方法
注意力
内核
线性
金字塔结构
上采样
分辨率
阶段
多尺度特征
令牌
像素
编码器解码器
压缩器
生成多尺度
模块
深度学习技术
通道
系统为您推荐了相关专利信息
图像分割方法
视盘
多尺度特征融合
混合损失函数
注意力机制
神经调控方法
神经调控系统
浅层卷积神经网络
调控策略
正弦交流电