摘要
本发明具体涉及一种用于视频异常检测的自回归得分匹配方法,包括:获取待处理视频中预设数量个视频帧,组成输入视频片段,将其输入条件噪声分数transformer模型,条件噪声分数transformer模型包括多层感知机、嵌入层、transformer块和线性层;用强度递增的噪声对输入视频片段进行扰动,并将扰动后的加噪数据分割为若干视频图像块;将视频图像块输入到嵌入层以得到嵌入向量;将控制噪声强度的扩散时间步长和场景类标签输入多层感知机以得到整体条件;将嵌入向量和与嵌入向量对应的整体条件输入transformer块进行处理,并使用线性层预测对图像块添加的噪声;通过自回归去噪得分匹配机制基于似然性获得异常评分。本发明方法可以很好地处理视频异常检测任务。
技术关键词
噪声强度
图像块
多层感知机
关键帧
视频帧
前馈神经网络
峰值信噪比
处理器
计算机程序产品
线性
注意力机制
运动
标签
场景
阶段
电子设备