摘要
本发明公开了一种视频监控中的目标行为检测方法、装置、设备及存储介质。该方法包括:获取监控区域的视频流数据;基于一种或多种预设行为检测模型对所述视频流数据中的图像进行检测,得到所述预设行为检测模型的检测结果图像;使用训练好的多模态大语言模型对所述检测结果图像进行过滤,得到监控目标图像。本发明所提供的技术方案,通过引入多模态大语言模型作为误报过滤机制进行二次分析,能够轻松适配不同的应用场景,结合所需的行为检测模型实现对指定行为的检测,从而可以灵活适应多样化的需求,同时也有效的减少了误报,提高了整体方案检测的准确性和可靠性,即使在复杂背景或光照条件下也可以保持较高的准确性,提升了用户体验。
技术关键词
大语言模型
视频流
图像
多模态
处理器
数据获取模块
计算机程序产品
过滤模块
计算机设备
内存
可读存储介质
视频帧
光照
存储器
机制
场景
系统为您推荐了相关专利信息
可解释人工智能
表达式
现场可编程门阵列
策略
蒸馏
变化检测方法
动态时空特征
多任务学习模型
耕地
多层卷积神经网络模型
移动机器人
深度强化学习
路径规划方法
全局路径规划
注意力机制