摘要
本发明公开了利用神经网络进行场景感知的合成人体运动生成。运动扩散模型可以在运动数据上进行预训练,并且场景感知组件(例如,神经网络的一个或更多个层)可以被连接并用于提取场景信息的表示并将其注入到预训练的运动扩散模型中。例如,为了预测沿特定3D场景中的路径的关节路径点的取向,可以将接受该场景的3D结构的表示的场景感知输入通道添加到预训练的运动扩散模型中。为了预测沿与该3D场景中的3D对象交互的路径的关节路径点的取向,可以将接受该3D对象和/或其表面的表示的场景感知输入通道添加到预训练的运动扩散模型中。因此,所得到的场景感知运动扩散模型可以在运动‑场景数据上进行调整,并用于生成人体运动。
技术关键词
虚拟现实内容
处理单元
运动
协作内容
数字孪生
数据中心
处理器
取向
机器人
对象交互
资产
生成场景
关节
身体
人体
音频
通道