一种基于视觉Transformer的特征聚焦图像语义分割方法

正文

推荐专利

申请号：CN202510095325

申请日期：2025-01-21

公开号：CN119904643A

公开日期：2025-04-29

类型：发明专利

摘要

本发明公开了一种基于视觉Transformer的特征聚焦图像语义分割方法，采用特征金字塔结构，生成四个不同尺寸大小的特征图，在特征图嵌入的过程中使用重叠块嵌入模块以保证特征图在分块的同时保证局部信息一定程度上的连续性，利用位置编码生成模块根据局部邻域信息动态地生成对应位置编码，保持计算机视觉中所需的平移不变性，然后在Transformer编码过程中采用结合了聚焦注意力机制和卷积运算的融合模块，利用自注意力机制把握整体结构和远距离的依赖关系、引入卷积注意力使得模型保持对局部信息的敏感性，使得模型能够同时整合全局和局部细节信息。最后模型各个阶段生成的不同尺寸的特征图输入到解码器中进行分割。本发明方法提高了对目标边界和复杂场景的分割表现。

技术关键词

图像语义分割方法注意力机制多尺度特征金字塔阶段模块编码器上采样解码器远距离计算机视觉连续性融合特征分块动态地策略

系统为您推荐了相关专利信息

一种智能笔筒

主控模块智能笔筒触摸按键模块显示屏连接器通信模块

一种农业机械精准播种装置

精准播种装置农业机械定量下料装置送料模块视觉识别传感器

报告编制防差错处理方法、装置、电子设备及存储介质

文本报告关注点网络分支

一种面向静态CT的分布式控制系统、控制方法及升级方法

中央控制模块分布式控制系统时序控制信号辅助控制模块运动控制模块

一种停车位消防感应灭火装置及方法

感应灭火装置停车位无人机协同消防水带

一种基于视觉Transformer的特征聚焦图像语义分割方法

站点导航

APP 下载