摘要
一种基于互补时空注意力机制的水面漂浮物检测方法,包括以下步骤:S1将固定机位拍摄的RGB帧进行光流计算,生成光流帧;S2将RGB帧与光流帧,逐帧送入两个参数共享的基于卷积神经网络构建的特征提取模块,提取空间特征信息;S3,将提取到的RGB、光流模态各层特征分别送入跨模态特征融合模块,生成融合特征,将融合特征送入特征金字塔,输出融合多尺度信息的特征;S4,将得到层级较低的特征送入短程全局Transformer模块,逐层提取含有高级语义信息的全局特征,与光流模态最后一层特征一起,经上采样后,送入处理相对层级较低的的长程局部Transformer模块,输出兼顾全局与局部建模的特征映射,送入全连接层后,输出水上漂浮物目标框所需的框系数和分类。本申请能够对视频画面中的水面漂浮物进行更加高效的检测。
技术关键词
时空注意力机制
空间特征信息
多层感知机
融合多尺度信息
特征提取模块
水上漂浮物
融合特征
特征金字塔
跨模态
层级
水面漂浮物
语义
像素
级联
参数
画面
分支