基于深度学习的三维手部姿态估计和动作识别算法

正文

推荐专利

申请号：CN202410842652

申请日期：2024-06-27

公开号：CN119049117A

公开日期：2024-11-29

类型：发明专利

摘要

本发明提供一种基于深度学习的三维手部姿态估计和动作识别算法，方法包括：获取公开第一人称手部动作数据集FPHA并进行预处理，对于处理好的数据集，根据实验条件按照设定比例取视频样本划分为训练集和测试集；建立基于深度学习包含双层transformer和轻量化姿态平滑网络smoothnet的三维手部姿态估计和动作识别模型；将处理后的第一人称手部动作数据集训练集利用分层移动窗口思想按照设定批次输入姿态估计和动作识别模型进行监督训练，将预处理后的数据送入预训练的ResNet模型进行浅层特征提取，然后送入第一层transformer利用编码短时帧间时序信息进行姿态估计并进行平滑优化，第二层transformer在更长的时间跨度上对二维手部姿态、操作物体分类信息、第一层编码时序信息后的特征图进行融合，建模姿态和动作的语义关系进而判断动作类型。通过本发明提出的方法，可以对第一人称手部动作视频进行更高精度的三维手部姿态估计和更高准确度的动作类型判断。

技术关键词

手部姿态估计动作识别模型识别算法多任务学习网络浅层特征提取展示动作分层视频序列训练集数据标签图像像素编码时序解码

系统为您推荐了相关专利信息

一种基于AI模型的堡垒机绕行事件审计预警方法

审计预警方法堡垒机视频流卷积神经网络模型网络信息安全技术

基于大模型的运维工单知识推荐方法及装置、介质、设备

运维文本知识推荐方法实体标签

基于光谱感知与结构搜寻的高光谱图像重建方法及系统

图像重建方法浅层特征提取结构网络深度特征提取堆叠结构

一种多视角立体重建中的特征金字塔网络及多视角立体重建方法

特征金字塔网络立体重建方法浅层特征提取多尺度特征提取多视角

一种基于物联网智能光传输设备的运维方法及系统

运维策略智能光传输设备识别故障数据设备识别

基于深度学习的三维手部姿态估计和动作识别算法

站点导航

APP 下载