摘要
本发明提供一种基于视觉特征增强的监控飞鸟目标检测方法,该方法通过傅里叶变换与Transformer机制的协同设计,实现对监控场景中飞鸟目标的高精度识别。该方法在YOLOv11主干网络中引入FSAS模块,对输入图像的特征表示进行预处理,先采用逐点卷积与深度卷积组合提取局部空间信息,随后借助傅里叶变换对其进行频域映射,挖掘目标的时序特征与结构模式。具体而言,该方法将FSAS模块与YOLOv11的C3K2模块、C2PSA模块嵌合,构建C3K2_FSAS和C2PSA_FSAS复合模块,在特征融合阶段通过频域相关性计算强化对飞鸟目标细节的捕捉能力,同时降低高分辨率图像下的计算复杂度。通过将特征分块进行局部傅里叶变换,挖掘空间域难以捕捉的目标关联特征,结合Transformer机制实现长距离依赖关系建模,有效提升对群聚飞鸟、遮挡目标的检测精度。
技术关键词
视觉特征
异构特征
交互机制
深度语义关联
非线性特征
层级
信息传递通路
感知特征
关系建模
特征提取工具
网络参数配置
注意力
语义信息提取
场景
创新型
融合特征
细粒度分类
多层次特征
系统为您推荐了相关专利信息
美甲
AI图像识别
UV灯
固化系统
图像采集参数
视觉问答方法
多模态信息
视觉特征
标签文本
融合方法
图像增强方法
雷达
变换器
径向速度信息
相机系统
新闻拆条
初始分割边界
视频流
嵌入特征
音频特征
教育玩具
指标
深度神经网络模型
数据
视觉特征提取