一种基于视觉语言大模型的人员异常行为检测方法及系统

AITNT
正文
推荐专利
一种基于视觉语言大模型的人员异常行为检测方法及系统
申请号:CN202411844645
申请日期:2024-12-13
公开号:CN119992641A
公开日期:2025-05-13
类型:发明专利
摘要
本公开的实施例提供了一种基于视觉语言大模型的人员异常行为检测方法及系统。应用于数据处理技术领域,所述方法包括:持续获取监控视频帧;若接收到文本指令,确定对应的第一文本特征向量;确定监控视频数据集,将监控视频数据集输入至预设的视觉语言大模型中,得到对应的第一视觉特征向量;将第一文本特征向量与第一视觉特征向量进行连接,得到第一多模态特征向量,并通过预设的视觉语言大模型的语言模型对第一多模态特征向量进行处理,得到文本指令对应的异常行为判断信息。本方案提升了人员异常行为检测的准确率,具有强大的泛化性能,能够适应不同场景下的行为识别;并且系统具有很强的可扩展性,可与其他安防技术无缝集成。
技术关键词
文本特征向量 视觉 语义标签 多模态 控制中心 监控视频流 场景 指令 视频帧 动态 检测方法系统 适配器 数据处理技术 安防技术 处理器通信
系统为您推荐了相关专利信息
1
一种基于AI智能驱动的轨道交通AR培训及作业优化方法及系统
头戴式AR设备 轨道交通环境 画像 三维模型库 SLAM技术
2
基于知识蒸馏的模型训练方法、装置、电子设备与可读存储介质
预测特征 学生 教师 网络 模型训练方法
3
一种建筑工程信息化管理系统
建筑工程信息化 分布式传感器 管理系统 服务器集群 无人机航拍系统
4
一种基于人工智能的法律文本信息提取增强方法及系统
逻辑 双向长短期记忆 三元组 条件随机场模型 对抗性
5
多源电子信息融合的博物馆智能监控系统
博物馆智能 环境传感器数据 视频监控数据 密度分布特征 安防设备启动
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号