摘要
本申请提供一种人体动作的视觉捕捉与评价方法及系统,其中方法包括:对人体动作视频,进行视频帧分解,得到多张单帧图像;利用第一Visual Transformer模型,对每张单帧图像进行检测,得到每张单帧图像的2D人体关节位置;根据每张单帧图像的2D人体关节位置,生成每张单帧图像对应的2D人体骨架;利用Transformer解码器,对每张单帧图像对应的2D人体骨架进行处理,得到每张单帧图像对应的3D人体姿态数据;根据3D人体姿态数据,得到每张单帧图像对应的3D人体模型;将每张单帧图像对应的3D人体模型与设定的标准动作进行比对,得到人体动作评分。本申请能够提高人体动作评价的准确性。
技术关键词
人体姿态数据
解码器
关节
人体骨架
图像
位置编码器
人体模型
人体动作评分
前馈神经网络
人体动作评价
评价方法
注意力机制
视频帧
手势
全局平均池化