基于深度学习的三维手部姿态估计和动作识别算法

AITNT
正文
推荐专利
基于深度学习的三维手部姿态估计和动作识别算法
申请号:CN202410842652
申请日期:2024-06-27
公开号:CN119049117A
公开日期:2024-11-29
类型:发明专利
摘要
本发明提供一种基于深度学习的三维手部姿态估计和动作识别算法,方法包括:获取公开第一人称手部动作数据集FPHA并进行预处理,对于处理好的数据集,根据实验条件按照设定比例取视频样本划分为训练集和测试集;建立基于深度学习包含双层transformer和轻量化姿态平滑网络smoothnet的三维手部姿态估计和动作识别模型;将处理后的第一人称手部动作数据集训练集利用分层移动窗口思想按照设定批次输入姿态估计和动作识别模型进行监督训练,将预处理后的数据送入预训练的ResNet模型进行浅层特征提取,然后送入第一层transformer利用编码短时帧间时序信息进行姿态估计并进行平滑优化,第二层transformer在更长的时间跨度上对二维手部姿态、操作物体分类信息、第一层编码时序信息后的特征图进行融合,建模姿态和动作的语义关系进而判断动作类型。通过本发明提出的方法,可以对第一人称手部动作视频进行更高精度的三维手部姿态估计和更高准确度的动作类型判断。
技术关键词
手部姿态估计 动作识别模型 识别算法 多任务学习网络 浅层特征提取 展示动作 分层 视频 序列 训练集 数据标签 图像像素 编码 时序 解码
系统为您推荐了相关专利信息
1
一种基于AI模型的堡垒机绕行事件审计预警方法
审计预警方法 堡垒机 视频流 卷积神经网络模型 网络信息安全技术
2
基于大模型的运维工单知识推荐方法及装置、介质、设备
运维 文本 知识推荐方法 实体 标签
3
基于光谱感知与结构搜寻的高光谱图像重建方法及系统
图像重建方法 浅层特征提取 结构网络 深度特征提取 堆叠结构
4
一种多视角立体重建中的特征金字塔网络及多视角立体重建方法
特征金字塔网络 立体重建方法 浅层特征提取 多尺度特征提取 多视角
5
一种基于物联网智能光传输设备的运维方法及系统
运维策略 智能光传输设备 识别故障 数据 设备识别
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号