基于记忆的多模态融合网络的多场景视频异常检测系统及方法

AITNT
正文
推荐专利
基于记忆的多模态融合网络的多场景视频异常检测系统及方法
申请号:CN202511088735
申请日期:2025-08-05
公开号:CN121010925A
公开日期:2025-11-25
类型:发明专利
摘要
本发明公开了一种基于记忆的多模态融合网络的多场景视频异常检测系统及方法,涉及视频分析技术领域。所述系统包括:编码器,用于分别将输入视频帧和光流图转换为向量表示的特征;多模态融合模块MMF,用于融合通过编码器获得的静态RGB特征和动态光流特征,根据当前场景特征自适应调整静态RGB特征和动态光流特征的权重;解码器,用于接收自适应融合后的静态RGB特征和动态光流特征,预测原始视频片段和初始光流片段的下一帧。所述系统通过充分利用模态之间的互补信息,提升了模型的泛化能力与鲁棒性。
技术关键词
异常检测系统 RGB特征 光流特征 内存模块 多模态 记忆 编码器 场景特征 网络 视频异常检测方法 融合特征 解码器 动态 视频分析技术 联合损失函数 注意力
系统为您推荐了相关专利信息
1
一种基于图像文本融合的细粒度农作物病害图像分类方法
农作物病害 图像分类方法 图像高维特征 图像编码器 图像特征提取
2
一种多模态视频数据与文本数据混合融合方法及系统
融合方法 多路径特征融合 视觉特征 文本 多模态
3
一种楼梯几何信息确定方法、装置及电子设备
楼梯台阶 线段 可见光图像 语义特征 融合特征
4
一种基于跨模态对齐的文本与人脸协同修复方法
协同修复方法 跨模态 混合损失函数 图像超分辨率 人脸
5
一种在线辅助语音对话场景的多模态情感提示方法及系统
提示方法 融合特征 交叉注意力机制 标签 场景
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号