面向室内安防监控视频场景的开放词汇群体行为检测方法

正文

推荐专利

申请号：CN202510315321

申请日期：2025-03-18

公开号：CN119851351B

公开日期：2025-06-17

类型：发明专利

摘要

本发明提供一种面向室内安防监控视频场景的开放词汇群体行为检测方法，属于视频动作识别领域。步骤如下：S1：收集并处理室内场景监控视频，获取含人有效视频片段，获得各有效视频片段的三元标注结果<视频，文本，标志>；S2：对视频每一帧和对应的文本，利用CLIP预训练模型的Swin‑B、BERT结构分别作为图像、文本编码器；Swin‑B和BERT参数均更新且用正则项约束，最终确定图像‑文本编码器；S3：构建、训练并确定开放词汇群体行为检测模型；S4：输入实际监控视频至开放词汇群体行为检测模型获得每个群体的行为类别。本发明能同时实现对室内安防监控视频中的每个人员识别出其属于哪个群体，并同时对每个群体的行为都进行分类，还能满足开放词汇检测需求。

技术关键词

室内安防监控文本编码器注意力模型多模态图像编码器矩形包围框标志场景行人检测编解码视频动作识别三元组融合特征解码器时序随机梯度下降序列

系统为您推荐了相关专利信息

基于多模态多尺度特征的超短期光伏功率预测方法及系统

卷积长短期记忆多尺度特征交叉注意力机制长短期记忆神经网络地基云图

一种多模态医学图像分割模型的自监督预训练方法

多模态医学图像预训练方法深度学习网络图像重建深度学习神经网络

一种参考图像分割方法及系统

图像分割方法文本切块图像分割模型网格

一种基于生物力学分析的膝关节疾病早期预警系统

膝关节疾病早期预警系统早期预警方法数据分析单元数据采集单元

一种基于联邦学习的心音-心电多模态融合检测方法

协同注意力融合检测方法数据差分隐私保护技术跨模态

面向室内安防监控视频场景的开放词汇群体行为检测方法

站点导航

APP 下载