摘要
本申请涉及计算机视觉技术领域,尤其涉及一种基于多模态大模型的人员行为识别方法及设备。首先基于第一检测小模型确定待分析视频中的每个第一图像帧中是否存在人脸,再针对每个存在人脸的第一图像帧,基于行为识别小模型确定该第一图像帧中人脸的预设对象的状态信息,根据每个存在人脸的第一图像帧对应的状态信息以及第一数量阈值,确定待分析视频中是否存在违规行为,只有在存在某一状态信息的第一图像帧的数量满足第一数量阈值的要求的情况下,才确定该待分析视频中存在违规行为,输出存在违规行为的提示信息,提高了人员行为识别的准确率。
技术关键词
图像
人脸
人体
视频
识别方法
多模态
计算机视觉技术
电子设备
处理器
对象
背光
存储器
系统为您推荐了相关专利信息
探测相机
腔衰荡光谱
缺陷检测装置
位移机构
场图像
三维重建方法
三维重建图像
特征金字塔网络
权重分配策略
弱纹理区域