摘要
本公开的实施例提供了一种基于视觉语言大模型的人员异常行为检测方法及系统。应用于数据处理技术领域,所述方法包括:持续获取监控视频帧;若接收到文本指令,确定对应的第一文本特征向量;确定监控视频数据集,将监控视频数据集输入至预设的视觉语言大模型中,得到对应的第一视觉特征向量;将第一文本特征向量与第一视觉特征向量进行连接,得到第一多模态特征向量,并通过预设的视觉语言大模型的语言模型对第一多模态特征向量进行处理,得到文本指令对应的异常行为判断信息。本方案提升了人员异常行为检测的准确率,具有强大的泛化性能,能够适应不同场景下的行为识别;并且系统具有很强的可扩展性,可与其他安防技术无缝集成。
技术关键词
文本特征向量
视觉
语义标签
多模态
控制中心
监控视频流
场景
指令
视频帧
动态
检测方法系统
适配器
数据处理技术
安防技术
处理器通信
系统为您推荐了相关专利信息
头戴式AR设备
轨道交通环境
画像
三维模型库
SLAM技术
建筑工程信息化
分布式传感器
管理系统
服务器集群
无人机航拍系统
逻辑
双向长短期记忆
三元组
条件随机场模型
对抗性
博物馆智能
环境传感器数据
视频监控数据
密度分布特征
安防设备启动