摘要
本发明公开了一种视线引导可供性感知的三维场景人类运动预测方法。包括如下步骤:1、构建注视引导的可供性学习模块:利用人体的注视点与场景点云之间的空间关系,生成交互热力图以定位目标物体,提取其交互位置、视觉特征和语义信息,形成可供性三元组;2、构建可供性感知的姿态生成模块:采用扩散模型生成一段人体交互姿态序列;3、构建双提示运动解码模块:结合交互位置与人体交互姿态序列,引导最终的人体运动预测过程。本发明引入“可供性”概念,结合人眼注视信息,精准推测用户意图,实现在复杂三维场景中具有语义一致性与物理合理性的动作预测,突破了传统方法对环境语义理解不足的局限。
技术关键词
人体交互姿态
运动预测方法
注视点
视觉特征
解码器
解码模块
序列
热力图
语义特征
三元组
实例分割网络
人类
物体
轨迹
场景特征
对象
系统为您推荐了相关专利信息
标定相机
坐标系
机械臂基座
标定板
自动化标定方法
拉弧检测方法
编码器算法
神经网络参数
解码器
数据
打标方法
广告
视觉特征提取
计算机电子设备
特征提取模块