一种基于多模态交互的异常特征增强的视频异常检测方法

正文

推荐专利

申请号：CN202511013712

申请日期：2025-07-23

公开号：CN120913122A

公开日期：2025-11-07

类型：发明专利

摘要

本发明公开了一种基于多模态交互的异常特征增强的视频异常检测方法，包括以下步骤：S1、获取监控区域视频、公共区域视频及预标注异常数据集，作为输入视频数据；S2、处理输入视频数据：S21、将输入视频数据分割为视频帧；S22、根据输入视频数据得到视频的语言文本描述，将其作为后续的文本特征信息；S3、将上述视觉特征信息与文本特征信息处理为同维度的特征，并输入到CLIP中进行特征空间模态匹配；S4、通过CLIP对异常视觉特征进行两次提取，得到特征更具有增强性与关键异常性，本发明通过视觉与语言两种模态交互的方式提取视频中具有异常的信息，使模型检测时更多关注于关键的异常特征，并且通过二次提取得到具有增强的、全面的关键异常。

技术关键词

视频异常检测方法多模态交互文本视频帧特征信息处理视觉特征信息相似性匹配方法异常数据注意力有效性字幕动态语义机制指标网络

系统为您推荐了相关专利信息

一种标签数据的生成方法、装置、电子设备及存储介质

多媒体文本热点生成内容标签特征提取网络

一种基于DeepSeek的角色大模型微调语料自动生成方法

自动生成方法知识库构造筛选出合格可读存储介质自动生成系统

一种基于医学文本的医疗知识问答方法

知识问答方法命名实体模型意图识别模型医疗知识图谱医疗文本数据

商品图生成方法、设备及存储介质

布局生成方法掩码矩阵文本校准特征

基于UNITER-Yolov5模型的多模态交通感知方法

图像卷积特征交通文本语义特征数据

一种基于多模态交互的异常特征增强的视频异常检测方法

站点导航

APP 下载