摘要
本发明涉及视频检测技术领域,具体涉及一种基于大语言模型的视频异常检测方法,该方法包括通过正常视频构建可检索的知识库;将待检测的视频提取视频片段后,通过大语言模型获取描述文本;将该描述文本编码为向量,并在知识库中检索获取最相似的多条行为模式;将最相似的多条行为模式,以及描述文本输入至大语言模型中,通过第三提示词引导,推理出待检测的视频是否异常。本发明通过引入大语言模型,克服了传统视频异常检测方法缺乏解释性的问题,能够在异常检测的同时输出详细的自然语言推理过程,明确描述异常事件发生的背景、行为逻辑和推理依据,大幅提升了检测结果的可理解性与决策参考价值。
技术关键词
视频异常检测方法
大语言模型
文本
模式
条目
自然语言推理
视频检测技术
生成自然语言
异常检测系统
编码
异常事件
时序
超参数
序列
模块
决策
格式
逻辑