摘要
本发明提供一种基于开放词汇的视频异常检测方法、装置以及电子设备,应用于视频异常检测技术领域,其中,包括:对区域视频数据进行特征提取,得到视觉信息与文本信息;对视觉信息进行图像编码,得到帧级视觉特征;确定帧级视觉特征的局部时间依赖关系与全局时序依赖关系,得到序列时序特征;对增强文本信息进行文本编码,得到标签文本特征;基于帧级视觉特征、序列时序特征以及标签文本特征,确定区域视频数据的已知类别异常与未见类别异常;对已知类别异常进行特定类别分类,得到特定异常行为;对未见类别异常进行无类别检测,得到未见类别异常行为,通过本申请能够提高视频数据中异常行为检测的准确率。
技术关键词
视频异常检测方法
视觉特征
时序依赖关系
标签文本
时序特征
预训练模型
人工智能模型
实时视频
图像编码
非暂态计算机可读存储介质
序列
异常检测技术
数据
语义
异常检测装置
地理位置信息
电子设备
系统为您推荐了相关专利信息
机器人抓取
工装
机床
视觉采集装置
视觉特征信息
柔性生产线
多智能体强化学习
时序特征
调度控制方法
通信网络