基于高效多尺度和简单注意力模块的领域泛化语义分割增强方法

正文

推荐专利

申请号：CN202510514512

申请日期：2025-04-23

公开号：CN120431328A

公开日期：2025-08-05

类型：发明专利

摘要

本发明公开了基于高效多尺度和简单注意力模块的领域泛化语义分割增强方法，属于计算机视觉领域。该模型基于文本查询驱动的掩码转换器(Textual Query‑driven Mask Transformer,TQDM)框架，并融合了高效多尺度注意力模块(Efficient Multi‑Scale Attention Module,EMA)和无参数简单注意力模块(Simple Parameter‑free Attention Module,SimAM)，以提升语义分割任务在多种域上的适应性和鲁棒性。本发明通过引入EMA模块，实现多尺度特征聚合与跨空间信息交互，从而增强模型对复杂场景的理解能力；同时，结合SimAM模块，在不增加额外参数的情况下优化特征表达，提高小目标分割和目标边界检测的精度。本发明可广泛应用于自动驾驶、智能监控、医学影像分析等涉及跨域语义分割的计算机视觉任务。

技术关键词

高效多尺度注意力语义跨模态模块文本编码器像素图像通道计算机视觉视觉特征解码器结构多尺度特征生成机制池化特征模态特征

系统为您推荐了相关专利信息

一种CMOS血氧传感系统及工作时序控制方法

光电探测器阵列传感系统数据转换模块时序控制模块低压差分信号

基于视觉分析的器械维护协助方法及系统

器械特征模板训练样本集高分辨率摄像头深度学习算法

一种自适应功率管理的微波发射系统

微波发射系统微波发射机功率管理雷达探测器干扰抑制模块

一种宽厚板四辊轧机智能转钢方法及系统

宽厚板四辊轧机坯料参数图像处理算法机器学习算法

基于多种深度学习的高层建筑施工安全监测方法及系统

卷积模块全局平均池化空间金字塔深度神经网络文本特征向量

基于高效多尺度和简单注意力模块的领域泛化语义分割增强方法

站点导航

APP 下载