摘要
本发明提供一种场景依赖的视频异常检测方法、装置、设备及存储介质,涉及人工智能技术领域,该方法包括:采用大语言模型对通用异常活动规则和目标场景的异常活动规则进行异常活动分析,得到目标场景的异常活动列表;在以待检测视频中每一帧图像为时间中心的时间窗口内均匀采样多帧图像,构建每一帧图像对应的视频片段;将每个视频片段中所有帧图像的字幕以及用于提示描述时间信息的摘要生成提示输入大语言模型,生成每个视频片段对应的时间摘要;将每个视频片段对应的时间摘要、目标场景的异常活动列表、异常评分提示以及输出格式要求提示输入大语言模型,得到待检测视频中每一帧图像的异常得分。本发明实现在场景依赖的情况下进行异常检测。
技术关键词
视频异常检测方法
大语言模型
场景
字幕
滑动窗口
摘要
文本编码器
列表
非暂态计算机可读存储介质
异常检测装置
图像编码器
视频编码器
处理器
人工智能技术
计算机程序产品
格式
模块
系统为您推荐了相关专利信息
大型水电站
协同优化方法
负荷预测模型
冷源设备
多场景
在线课程推荐方法
大语言模型
课程推荐系统
文本
兴趣
生成系统
输入模块
预训练模型
输出模块
RNN模型
电网运行参数
电网故障诊断方法
电网故障数据
电网故障诊断系统
电网关键节点