摘要
本发明提供一种面向遮挡场景下的基于单目视频的单人3D姿态估计方法,涉及姿态估计技术领域。利用人体先验知识对2D关键点进行分组,并在模型训练阶段通过随机遮挡部分2D关键点分组的方式进行数据增强,模拟遮挡场景下的人体姿态数据;设计融合图卷积神经网络GCN和时序卷积神经网络TCN的3D人体姿态估计网络架构,GCN的输出作为TCN的输入,实现对空间与时间信息的联合建模。本发明方法不仅有效降低对复杂硬件、场景设置以及人工标注的依赖,还通过灵活生成多种遮挡情况,使数据集能快速扩展,从而大幅度提高数据集构建效率;不仅能够在遮挡场景下准确估计人体姿态,还在一定程度上减轻了输出视频中的抖动问题,从而提升估计结果的平滑性和稳定性。
技术关键词
姿态估计方法
遮挡场景
时序卷积神经网络
关键点
节点特征
混合膨胀卷积
人体姿态估计
人体姿态数据
准确估计人体姿态
单人
人体骨骼
邻居
矩阵
视频
姿态估计技术
关节点
网络架构
多头注意力机制
系统为您推荐了相关专利信息
节点特征
分割方法
顶点特征
分割系统
线性变换矩阵
物流信息查询方法
逻辑回归模型
构建机器学习模型
分类阈值
异常状态
情绪识别方法
深度特征提取
采集脑电信号
识别特征
脑电特征