摘要
本发明涉及计算机视觉和神经网络处理技术领域,尤其涉及一种基于多模态神经网络框架的人体姿态识别方法。包括:采集事件数据,利用五通道事件表示方法表示事件数据;将预处理后的五通道事件数据分为三个通道,空间、事件特性和点云通道;完成通道拆分后,分别进行特征提取,通过动态特征增强以及跨模态融合,将不同模态的特征进行优化和整合;采用骨架约束模块和时空联合处理模块,增强网络对人体结构的理解和时空依赖关系建模;采用预测头模块,输出最终的人体关键点坐标;采用多任务学习框架进行训练优化,得到姿态识别结果。优点在于:有效地处理事件数据的稀疏异步特性,解决静态肢体的“盲点问题”,保持低功耗、实现高精度的人体姿态估计。
技术关键词
人体姿态识别方法
神经网络框架
多模态
跨模态
时间门控
通道
脉冲特征
区域特征提取
注意力机制
事件特征
全局特征提取
人体结构
人体关键点
人体骨架
特征提取模块
数据
多层感知机
混合特征提取
系统为您推荐了相关专利信息
视觉特征
语音特征
视觉图像信息
多模态特征融合
融合特征
多模态情绪
人脸表情
识别方法
FIR滤波器
编码器
人工智能客服系统
多模态情绪
自然语言
意图类别
文本
认知障碍筛查
多模态数据采集
速查工具
关键词
诊断系统