一种XR场景实时人体姿态追踪方法及系统

AITNT
正文
推荐专利
一种XR场景实时人体姿态追踪方法及系统
申请号:CN202511136967
申请日期:2025-08-14
公开号:CN120635151B
公开日期:2025-10-28
类型:发明专利
摘要
本发明公开了一种XR场景实时人体姿态追踪方法及系统,本发明涉及计算机视觉技术领域,解决了无法突破视觉与时序特征的模态壁垒以及扩散模型退化的技术问题,本发明通过针对 RGB 图像,动态高斯滤波和ROI裁剪,既抑制噪声又聚焦人体区域,历史姿态归一化覆盖空间、时间、生理约束,确保输入数据物理意义一致,实现多维度、场景自适应的预处理,为后续算法奠定数据基础,交叉注意力机制打破视觉与时序特征的模态边界,生成多模态条件向量,同时编码当前肢体外观与历史运动趋势,为扩散模型提供精准推理依据,实现动态、场景自适应的特征协同,基于前5帧构建理论姿态,与扩散模型初步预测动态融合,契合运动惯性则保留细节。
技术关键词
姿态追踪方法 交叉注意力机制 图像编码器 时序特征 视觉特征 关节 损失函数优化 追踪系统 场景 后处理模块 噪声预测 多模态 人体 姿态归一化 RGB摄像头 卡尔曼滤波算法
系统为您推荐了相关专利信息
1
一种语音驱动的高效果的数字人口型合成算法
音频特征 音频编码器 生成对抗网络 图像编码器 语音
2
基于强化学习和BI-RADS指南的超声图像识别方法
超声图像识别方法 图像识别模型 视觉特征 深度Q学习 图像类别
3
一种考虑弱量测的低压分布式光伏高渗透的地区短期负荷预测方法
短期负荷预测方法 低压分布式光伏 神经网络预测模型 双向长短期记忆 时序特征
4
光通信装置的神经网络自适应调制方法及系统
时序特征 光通信装置 自动编码器 深度卷积神经网络 长短期记忆网络
5
一种基于大模型知识增强的工业设备使用寿命预测方法
序列 大语言模型 文本 数据 表达式
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号