基于上下文信息的连续视频人体行为定位方法

正文

推荐专利

申请号：CN202411629215

申请日期：2024-11-14

公开号：CN119559696A

公开日期：2025-03-04

类型：发明专利

摘要

本发明属于动作识别技术领域，提供了一种基于上下文信息的连续视频人体行为定位方法。将候选动作分为开始、执行和结束三个阶段，依次对应候选框上文信息、候选框信息和候选框下文信息；利用卷积网络模型生成连续视频的帧级特征；以候选框的起止点为中心分别定义开始框和结束框，将候选框作为节点，通过注意力机制网络聚合节点邻域信息生成候选框上下文信息图谱。基于候选框上下文信息图谱形成行为定位网络模型，实现对视频的有效分割。本发明融合了动作阶段划分、特征提取、上下文图谱生成与模型构建，提升了候选框质量，实现了上下文信息的自适应聚合，细化了边界，克服了传统方法边界模糊的缺陷，进一步提高了候选框精度。

技术关键词

卷积网络模型定位方法视频注意力机制编码器动作识别技术图谱人体解码器生成特征节点邻域非线性阶段定义精度基础尺寸模块

系统为您推荐了相关专利信息

超临界机组宽负荷建模方法、装置、电子设备及存储介质

超临界机组门控循环单元负荷建模方法分支负荷建模装置

一种基于PSO-DETR的无人机航拍图像目标检测方法

无人机航拍图像通道特征选择机制网络深层特征提取

一种半监督遥感影像语义分割模型训练方法及装置

遥感影像数据语义分割网络解码器教师学生

摄像头和监控系统联动对电气设备的监视分析方法

监视分析方法电气设备监控系统巡视系统特征提取方法扩充训练样本

一种融合视觉提示的田间稻飞虱检测计数方法及装置

检测计数方法原型融合视觉图像解码器编码特征

基于上下文信息的连续视频人体行为定位方法

站点导航

APP 下载