摘要
本发明公开了一种基于动态频率调制注意力的图像分割方法及系统,属于计算机视觉技术领域。该方法旨在解决现有Vision Transformer(ViT)模型因自注意力机制的低通滤波特性导致高频信息丢失、影响分割精度的问题。本发明方法包括:在ViT模型架构中引入动态频率调制注意力模块,该模块包含注意力反转机制和动态频率缩放机制,用于调制注意力机制和特征图的频率响应,构建基于动态频率调制注意力的分割模型;采用适用于图像分割任务的损失函数对该模型进行端到端训练;使用训练好的模型对输入图像进行推理,得到最终的分割结果。本发明的系统包括动态频率调制注意力图像分割模型搭建模块、语义分割网络训练模块和语义分割推理模块。本发明通过动态频率调制注意力,增强模型对不同频率信息的捕捉能力,特别是在高频细节和低频结构信息方面,从而提高图像分割精度,增强特征表达能力,并且计算复杂度低,易于集成。
技术关键词
语义分割网络
注意力机制
图像语义分割
图像分割方法
动态
语义分割模型
搭建模块
深度卷积网络
图像分割模型
像素
低通滤波器组合
频率响应
图像块
输出特征
矩阵
融合语义分割
系统为您推荐了相关专利信息
遥感影像数据
分类模型构建方法
全局特征提取
构建分类器
多尺度特征
指标
数据监管方法
双层长短期记忆网络
故障预测模型
服务器
数据智能管理方法
样本
参数
生理状态变化趋势
动态修正方法