摘要
本发明公开了一种XR场景实时人体姿态追踪方法及系统,本发明涉及计算机视觉技术领域,解决了无法突破视觉与时序特征的模态壁垒以及扩散模型退化的技术问题,本发明通过针对 RGB 图像,动态高斯滤波和ROI裁剪,既抑制噪声又聚焦人体区域,历史姿态归一化覆盖空间、时间、生理约束,确保输入数据物理意义一致,实现多维度、场景自适应的预处理,为后续算法奠定数据基础,交叉注意力机制打破视觉与时序特征的模态边界,生成多模态条件向量,同时编码当前肢体外观与历史运动趋势,为扩散模型提供精准推理依据,实现动态、场景自适应的特征协同,基于前5帧构建理论姿态,与扩散模型初步预测动态融合,契合运动惯性则保留细节。
技术关键词
姿态追踪方法
交叉注意力机制
图像编码器
时序特征
视觉特征
关节
损失函数优化
追踪系统
场景
后处理模块
噪声预测
多模态
人体
姿态归一化
RGB摄像头
卡尔曼滤波算法
系统为您推荐了相关专利信息
音频特征
音频编码器
生成对抗网络
图像编码器
语音
超声图像识别方法
图像识别模型
视觉特征
深度Q学习
图像类别
短期负荷预测方法
低压分布式光伏
神经网络预测模型
双向长短期记忆
时序特征
时序特征
光通信装置
自动编码器
深度卷积神经网络
长短期记忆网络