基于扩散模型和文本嵌入的视频异常检测方法

正文

推荐专利

申请号：CN202411616282

申请日期：2024-11-13

公开号：CN119580146B

公开日期：2025-11-28

类型：发明专利

摘要

本发明公开了基于扩散模型和文本嵌入的视频异常检测方法，涉及视频异常检测技术领域。本发明提供的基于扩散模型和文本嵌入的视频异常检测方法，包括首先利用图文生成模型提取各视频帧的文本信息，再通过预训练的CLIP文本编码器得到语义特征；基于图像扩散模型和文本扩散模型，构建视频异常检测模型，并利用交叉注意力机制分别引导图像扩散去噪网络、文本扩散去噪网络重构图像特征和文本特征，再通过整体优化完成模型训练，进而对视频异常进行检测。因此，采用上述方法，能够借助扩散模型的强大生成能力和图生文模型的语义理解能力，缓解了特定场景下的过度泛化问题，增强了视频异常检测的可解释性，提高视频异常检测模型的性能。

技术关键词

视频异常检测方法交叉注意力机制语义特征重构文本编码器图像编码器异常检测技术图像解码器自动编码器网络模块图文视频帧噪声场景

系统为您推荐了相关专利信息

一种旋转导向系统的姿态测量方法、系统、设备及介质

加速度语义特征旋转导向系统姿态测量方法压缩特征

基于上下文扩展的人机混合文本检测方法

文本检测方法序列滑动窗口机制人机分类网络

一种基于动态分区的无人机多摄像头协同视频解码与多源增强方法

视频解码无人机分区超分辨率动态

一种提高便携式近红外光谱数据分析精度的方法

卷积神经网络模型偏最小二乘回归模型可溶性固形物含量超分辨率重构葡萄

一种异构设备动态拓扑协同控制方法及系统

异构设备协同控制方法重构策略强化学习算法电气自动化系统

基于扩散模型和文本嵌入的视频异常检测方法

站点导航

APP 下载