摘要
本发明提供了一种基于运动‑外观多层次聚类的无监督视频目标分割方法,通过将视频帧输入到主干网络提取运动特征;设计位置‑通道注意力模块增强时空上下文建模;通过多层次聚类细化策略融合运动和外观特征;利用重建光流作为运动强度指示器,结合子空间聚类多视图分析提高复杂场景处理能力;最终输出目标分割掩码。本发明不仅能够从FlowFormer++光流网络和位置‑通道注意力模块中提取判别性运动特征,并且提出的多层次聚类细化策略能够将Vision Transformer主干网络中的运动和外观特征有效融合,此外,本发明设计的子空间聚类多视图分析能够将特征中更大的权重集中在前景目标区域中,过滤掉无用的背景信息,与现有的无监督视频目标分割方法相比具有更高的分割精度。
技术关键词
分割方法
多层次
光流特征
矩阵
运动特征
聚类
加权特征
原型
特征分布信息
通道
强度指示器
视频帧
编码器
网络
注意力机制
语义特征
策略
系统为您推荐了相关专利信息
调制信号分类方法
矩阵
LSTM神经网络
符号
浮点数
病害检测方法
无人机巡检
SURF算法
可见光图像
成像
融合语义
实体关系抽取方法
文本
实体关系抽取模型
节点特征