一种基于多模态大模型的人员行为识别方法及设备

AITNT
正文
推荐专利
一种基于多模态大模型的人员行为识别方法及设备
申请号:CN202411640024
申请日期:2024-11-15
公开号:CN119785414A
公开日期:2025-04-08
类型:发明专利
摘要
本申请涉及计算机视觉技术领域,尤其涉及一种基于多模态大模型的人员行为识别方法及设备。首先基于第一检测小模型确定待分析视频中的每个第一图像帧中是否存在人脸,再针对每个存在人脸的第一图像帧,基于行为识别小模型确定该第一图像帧中人脸的预设对象的状态信息,根据每个存在人脸的第一图像帧对应的状态信息以及第一数量阈值,确定待分析视频中是否存在违规行为,只有在存在某一状态信息的第一图像帧的数量满足第一数量阈值的要求的情况下,才确定该待分析视频中存在违规行为,输出存在违规行为的提示信息,提高了人员行为识别的准确率。
技术关键词
图像 人脸 人体 视频 识别方法 多模态 计算机视觉技术 电子设备 处理器 对象 背光 存储器
系统为您推荐了相关专利信息
1
氛围灯照亮宽度测试方法及其测试系统
氛围灯 光度计 测试方法 像素点 亮度
2
西藏地区典型居住建筑布局优化设计方法及其系统
西藏地区 居住建筑 点云图像 布局优化设计 典型
3
田间环境下麦穗表型性状测量方法及装置
尺寸标尺 田间环境 深度学习模型 像素 中心线
4
一种腔衰荡光谱仪器的明暗场腔镜缺陷检测装置及方法
探测相机 腔衰荡光谱 缺陷检测装置 位移机构 场图像
5
一种基于动态遮挡感知与多先验融合的稀疏视图三维重建方法及系统
三维重建方法 三维重建图像 特征金字塔网络 权重分配策略 弱纹理区域
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号