一种基于视觉语言大模型的人员异常行为检测方法及系统

正文

推荐专利

申请号：CN202411844645

申请日期：2024-12-13

公开号：CN119992641A

公开日期：2025-05-13

类型：发明专利

摘要

本公开的实施例提供了一种基于视觉语言大模型的人员异常行为检测方法及系统。应用于数据处理技术领域，所述方法包括：持续获取监控视频帧；若接收到文本指令，确定对应的第一文本特征向量；确定监控视频数据集，将监控视频数据集输入至预设的视觉语言大模型中，得到对应的第一视觉特征向量；将第一文本特征向量与第一视觉特征向量进行连接，得到第一多模态特征向量，并通过预设的视觉语言大模型的语言模型对第一多模态特征向量进行处理，得到文本指令对应的异常行为判断信息。本方案提升了人员异常行为检测的准确率，具有强大的泛化性能，能够适应不同场景下的行为识别；并且系统具有很强的可扩展性，可与其他安防技术无缝集成。

技术关键词

文本特征向量视觉语义标签多模态控制中心监控视频流场景指令视频帧动态检测方法系统适配器数据处理技术安防技术处理器通信

系统为您推荐了相关专利信息

一种基于AI智能驱动的轨道交通AR培训及作业优化方法及系统

头戴式AR设备轨道交通环境画像三维模型库 SLAM技术

基于知识蒸馏的模型训练方法、装置、电子设备与可读存储介质

预测特征学生教师网络模型训练方法

一种建筑工程信息化管理系统

建筑工程信息化分布式传感器管理系统服务器集群无人机航拍系统

一种基于人工智能的法律文本信息提取增强方法及系统

逻辑双向长短期记忆三元组条件随机场模型对抗性

多源电子信息融合的博物馆智能监控系统

博物馆智能环境传感器数据视频监控数据密度分布特征安防设备启动

一种基于视觉语言大模型的人员异常行为检测方法及系统

站点导航

APP 下载