基于扩散模型和文本嵌入的视频异常检测方法

AITNT
正文
推荐专利
基于扩散模型和文本嵌入的视频异常检测方法
申请号:CN202411616282
申请日期:2024-11-13
公开号:CN119580146B
公开日期:2025-11-28
类型:发明专利
摘要
本发明公开了基于扩散模型和文本嵌入的视频异常检测方法,涉及视频异常检测技术领域。本发明提供的基于扩散模型和文本嵌入的视频异常检测方法,包括首先利用图文生成模型提取各视频帧的文本信息,再通过预训练的CLIP文本编码器得到语义特征;基于图像扩散模型和文本扩散模型,构建视频异常检测模型,并利用交叉注意力机制分别引导图像扩散去噪网络、文本扩散去噪网络重构图像特征和文本特征,再通过整体优化完成模型训练,进而对视频异常进行检测。因此,采用上述方法,能够借助扩散模型的强大生成能力和图生文模型的语义理解能力,缓解了特定场景下的过度泛化问题,增强了视频异常检测的可解释性,提高视频异常检测模型的性能。
技术关键词
视频异常检测方法 交叉注意力机制 语义特征 重构 文本编码器 图像编码器 异常检测技术 图像解码器 自动编码器 网络 模块 图文 视频帧 噪声 场景
系统为您推荐了相关专利信息
1
一种旋转导向系统的姿态测量方法、系统、设备及介质
加速度 语义特征 旋转导向系统 姿态测量方法 压缩特征
2
基于上下文扩展的人机混合文本检测方法
文本检测方法 序列 滑动窗口机制 人机 分类网络
3
一种基于动态分区的无人机多摄像头协同视频解码与多源增强方法
视频解码 无人机 分区 超分辨率 动态
4
一种提高便携式近红外光谱数据分析精度的方法
卷积神经网络模型 偏最小二乘回归模型 可溶性固形物含量 超分辨率重构 葡萄
5
一种异构设备动态拓扑协同控制方法及系统
异构设备 协同控制方法 重构策略 强化学习算法 电气自动化系统
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号