基于多尺度线性注意力与U型结构的图像语义分割方法

AITNT
正文
推荐专利
基于多尺度线性注意力与U型结构的图像语义分割方法
申请号:CN202510510522
申请日期:2025-04-23
公开号:CN120451533A
公开日期:2025-08-08
类型:发明专利
摘要
基于多尺度线性注意力与U型结构的图像语义分割方法,属于图像分割和深度学习技术领域,包括将图片输入到编码器中,采用卷积stem进行局部信息提取;构建编码器,采用金字塔结构跨四个阶段使用Transformer Block计算多尺度特征;构建解码器,包括四个阶段,使用跳跃连接合并编码器和解码器每个阶段的特征;将解码器的第四阶段输出进行上采样操作,将分辨率恢复为输入分辨率,并使用线性层将特征图转换为分割掩码。本发明将多尺度线性注意力机制技术整合到U行编码器解码器架构中,这种集成不仅降低了计算成本,还提高了感受野交互和分割精度。在解码器中,采用CARAFE层进行上采样,有助于保留复杂的细节并提高器官边缘分割的精度。
技术关键词
图像语义分割方法 注意力 内核 线性 金字塔结构 上采样 分辨率 阶段 多尺度特征 令牌 像素 编码器解码器 压缩器 生成多尺度 模块 深度学习技术 通道
系统为您推荐了相关专利信息
1
一种基于神经网络的智能辅助瞄准方法及系统
辅助瞄准方法 子弹 视场角 图像 双线性插值算法
2
一种基于全监督的视盘萎缩弧图像分割方法
图像分割方法 视盘 多尺度特征融合 混合损失函数 注意力机制
3
一种基于注意力状态的智能神经调控方法及系统
神经调控方法 神经调控系统 浅层卷积神经网络 调控策略 正弦交流电
4
基于虚拟扫描的无监督欠采样非视域成像方法
成像方法 单光子探测器 解码器结构 数据 框架
5
地层纵波声速预测方法及装置
纵波声速 横波声速 速度预测模型 套管井 中子
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号