基于动态频率调制注意力的图像分割方法及系统

正文

推荐专利

申请号：CN202510753548

申请日期：2025-06-06

公开号：CN120655920A

公开日期：2025-09-16

类型：发明专利

摘要

本发明公开了一种基于动态频率调制注意力的图像分割方法及系统，属于计算机视觉技术领域。该方法旨在解决现有Vision Transformer(ViT)模型因自注意力机制的低通滤波特性导致高频信息丢失、影响分割精度的问题。本发明方法包括：在ViT模型架构中引入动态频率调制注意力模块，该模块包含注意力反转机制和动态频率缩放机制，用于调制注意力机制和特征图的频率响应，构建基于动态频率调制注意力的分割模型；采用适用于图像分割任务的损失函数对该模型进行端到端训练；使用训练好的模型对输入图像进行推理，得到最终的分割结果。本发明的系统包括动态频率调制注意力图像分割模型搭建模块、语义分割网络训练模块和语义分割推理模块。本发明通过动态频率调制注意力，增强模型对不同频率信息的捕捉能力，特别是在高频细节和低频结构信息方面，从而提高图像分割精度，增强特征表达能力，并且计算复杂度低，易于集成。

技术关键词

语义分割网络注意力机制图像语义分割图像分割方法动态语义分割模型搭建模块深度卷积网络图像分割模型像素低通滤波器组合频率响应图像块输出特征矩阵融合语义分割

系统为您推荐了相关专利信息

基于多模态的宫颈病理图像分类模型的训练方法及系统

宫颈图像分类模型多模态框架动态迁移数据

基于国产神威处理器的pytorch移植方法

处理器高性能 Python扩展模块动态链接库 CUDA平台

基于多源数据融合的航运物流流向预测方法及系统

物流船舶自动识别系统长短期记忆神经网络时间段深度学习模型

一种针对医药管理数据的后处理方法和装置

医药知识图谱异常数据后处理方法逻辑动态

一种多模块容错控制的车内设备CAN指令解析方法

指令解析方法容错控制时效性控制类指令语义特征

基于动态频率调制注意力的图像分割方法及系统

站点导航

APP 下载