摘要
本发明公开的属于深度学习以及人工智能技术领域,具体为一种轻量级的由视频估计3D人体姿态的算法,包括具体步骤如下:S1,第一阶段:输入RGB图像,利用深度学习模型提取2D关键点特征并预测人体关键点的2D坐标,并以热图形式表示,精确标识关键点在2D图像中的位置;S2,第二阶段:基于2D关键点,利用LitePoseFormer算法通过几何约束、运动学约束进行3D姿态重建,并结合相机参数或深度信息优化三维坐标的估计。本发明通过利用LitePoseFormer算法进行3D姿态重建,不仅能够降低内存消耗和计算成本,还能够提高每个Transformer的针对性,且能够避免信息丢失,提高中心帧姿态估计的精度。
技术关键词
匈牙利算法
交叉注意力机制
关节
视频
人体关键点
坐标
关键点特征提取
深度学习模型
姿态估计
空间位置关系
矩阵
置信度阈值
人工智能技术
人体骨骼
系统为您推荐了相关专利信息
多模态特征融合
状态识别方法
多头注意力机制
认知状态识别
标签
智能交互方法
智能投影设备
对象
娱乐装置
感应设备
类风湿关节炎疾病
标志物
模型构建方法
类风湿关节炎患者
曲线分析方法
环境识别方法
网络节点
关键帧
运动向量数据
密度
骨关节疾病
电子医疗系统
多任务学习模型
无线网络
患者