基于记忆的多模态融合网络的多场景视频异常检测系统及方法

正文

推荐专利

申请号：CN202511088735

申请日期：2025-08-05

公开号：CN121010925A

公开日期：2025-11-25

类型：发明专利

摘要

本发明公开了一种基于记忆的多模态融合网络的多场景视频异常检测系统及方法，涉及视频分析技术领域。所述系统包括：编码器，用于分别将输入视频帧和光流图转换为向量表示的特征；多模态融合模块MMF，用于融合通过编码器获得的静态RGB特征和动态光流特征，根据当前场景特征自适应调整静态RGB特征和动态光流特征的权重；解码器，用于接收自适应融合后的静态RGB特征和动态光流特征，预测原始视频片段和初始光流片段的下一帧。所述系统通过充分利用模态之间的互补信息，提升了模型的泛化能力与鲁棒性。

技术关键词

异常检测系统 RGB特征光流特征内存模块多模态记忆编码器场景特征网络视频异常检测方法融合特征解码器动态视频分析技术联合损失函数注意力

系统为您推荐了相关专利信息

一种基于图像文本融合的细粒度农作物病害图像分类方法

农作物病害图像分类方法图像高维特征图像编码器图像特征提取

一种多模态视频数据与文本数据混合融合方法及系统

融合方法多路径特征融合视觉特征文本多模态

一种楼梯几何信息确定方法、装置及电子设备

楼梯台阶线段可见光图像语义特征融合特征

一种基于跨模态对齐的文本与人脸协同修复方法

协同修复方法跨模态混合损失函数图像超分辨率人脸

一种在线辅助语音对话场景的多模态情感提示方法及系统

提示方法融合特征交叉注意力机制标签场景

基于记忆的多模态融合网络的多场景视频异常检测系统及方法

站点导航

APP 下载