基于多模态大模型的课堂行为检测方法

正文

推荐专利

基于多模态大模型的课堂行为检测方法

申请号：CN202510645941

申请日期：2025-05-20

公开号：CN120183048B

公开日期：2025-11-11

类型：发明专利

摘要

本发明公开了一种基于多模态大模型的课堂行为检测方法，具体包括：摄像头拍摄的视频文件作为输入数据，所述视频文件可以直接输入GroundingDINO进行目标检测，也可以先进行人脸识别，采用人脸识别InsightFace中的Sub‑Center ArcFace模型，识别到指定对象的人脸后可将人脸区域图像或目标框作为提示信息给到TrackAnything模型进行视频目标追踪，即在视频的每一帧中找到该对象的目标区域，接着将该区域单独送入GroundingDINO进行目标检测，判断是否是待检测行为目标。本发明可以得到每个人的行为检测结果，进而进行个体或群体的行为统计分析。

技术关键词

模板更新策略人脸多模态图像特征提取后处理技术校正机制视频对象特征提取模块生成代表计算机程序产品视角连续性位置更新动态身份框架滑动窗口

系统为您推荐了相关专利信息

一种基于多阶段关节点增强的手部姿态重建方法

姿态重建方法关节点关节特征多阶段手部特征

一种融合振动光纤、雷达感知与视频监控的AI周界报警系统

网格多模态点云雷达散射截面多维特征向量

基于深度学习的污水水质预测方法及系统

水质预测方法智能决策支持多模态卷积神经网络多模态数据融合特征工程

基于光电超表面与雷达融合的多模态人体识别系统与方法

人体识别系统超表面人体识别方法微多普勒相位可编程

一种多模态传感器的帕金森肌强直症状评估系统及方法

多模态数据采集帕金森多模态传感器震颤数据采集单元

基于多模态大模型的课堂行为检测方法

站点导航

APP 下载