摘要
本发明公开了一种基于生成模型隐式表征的视频检测方法及装置,获取待检测视频,并通过视频生成模型对待检测视频进行隐式特征提取,得到隐式表征;通过骨干网络对待检测视频进行特征提取,得到时空特征;通过残差交叉注意力机制对隐式表征与时空特征进行特征融合,得到融合特征;基于融合特征,通过分类器输出待检测视频的检测结果。本发明通过结合视频生成模型的内在统计特性与骨干网络提取的时空特征,增强了对于各类扰动的鲁棒性,提高了泛化性。
技术关键词
视频生成模型
融合特征
交叉注意力机制
视频检测方法
多层感知器
对齐模块
非临时性计算机可读存储介质
特征提取模块
网络
视频检测装置
分类器
编码器
处理器通信
存储器
鲁棒性
电子设备