摘要
本发明公开了一种基于扩散变压器先验的三维人体姿态估计方法及系统,属于计算机视觉领域。本发明利用预训练的动作‑扩散Transformer模型所学习到的人体运动分布作为先验知识,以约束世界坐标系下的人体姿态估计结果,使得在不需要三维真实标注监督学习的前提下,让人体姿态估计结果与二维观测保持一致性并更符合自然运动的规律,从而可以通过单目RGB视频准确估计出世界坐标系下的三维人体姿态序列,提高世界坐标系下三维人体姿态估计的准确性,降低计算成本。
技术关键词
三维人体姿态估计
坐标系
变压器
缩放参数
前馈神经网络
多层感知机
注意力机制
相机
噪声预测
序列
关节点
蒸馏
视频
系统为您推荐了相关专利信息
图像采集参数
视觉伺服控制系统
捞渣机器人
物体
视觉传感器