一种基于多模态特征对齐的视频异常检测方法以及装置

AITNT
正文
推荐专利
一种基于多模态特征对齐的视频异常检测方法以及装置
申请号:CN202510589894
申请日期:2025-05-08
公开号:CN120451673A
公开日期:2025-08-08
类型:发明专利
摘要
本发明涉及视频异常检测技术,揭露了一种基于多模态特征对齐的视频异常检测方法,包括:提取目标视频的视觉文本类别标签并生成视觉完整语句提示后输入至文本编码器中得到视觉文本特征;利用视觉时间网络提取目标视频的视觉特征,根据视觉文本特征和视觉特征获取视觉‑文本对齐图及跨模态增强视觉特征;提取目标视频中音频文件,并获取音频‑文本对齐图及跨模态增强音频特征;将跨模态增强视觉特征和跨模态增强音频特征拼接后输入至异常分类器中得到异常分类结果;利用视觉‑文本对齐图与音频‑文本对齐图获取事件类别分类结果。本发明还提出一种基于多模态特征对齐的视频异常检测装置、设备以及介质。本发明可以提高视频异常检测的准确性。
技术关键词
视频异常检测方法 多模态特征 局部视觉特征 跨模态 注意力 音频特征 序列特征 文本编码器 文本特征值 掩码矩阵 异常检测装置 语句 融合视觉
系统为您推荐了相关专利信息
1
一种API语义矢量化Transformer恶意代码检测方法和系统
恶意代码检测方法 恶意代码家族 特征提取模型 恶意代码分类 恶意代码检测系统
2
基于多频带交叉注意力机制的信号伪迹去除方法、系统
交叉注意力机制 计算机装置设备 处理器 频率 卷积神经网络模型
3
一种基于梯度热阻优化的全碳化硅双面散热模块封装方法
散热模块 封装方法 矩阵 三明治结构 层叠式散热结构
4
一种非铺装路面识别与分类系统
分类系统 路面识别方法 车辆动力学模型 前端数据采集模块 卷积神经网络框架
5
一种基于多模态大模型的智能体架构
模块 记忆 画像 多模态 大语言模型
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号