摘要
本发明公开了一种文本驱动的人‑物交互动作动画生成方法、设备及介质,其中方法包括:构建交互距离场:通过计算人体关节点与物体关键点之间的IDF矩阵,表征两者在交互过程中的动态空间关系;构建人‑物交互动作生成扩散模型:将多模态条件分别经MLP嵌入后输入Transformer网络,通过时空依赖建模生成语义匹配的交互动作;构建人‑物关系扩散模型:以IDF矩阵作为输入,引入时空自注意力机制,捕捉局部交互关系、时间依赖性及帧间依赖关系,进而建模人体与物体的动态交互模式;基于IDF矩阵引导人‑物交互动作生成。本发明通过联合建模动作与交互关系,显著提升了交互动作的物理合理性和运动时空连贯性,在动画生成精度与控制性方面具有技术优势。
技术关键词
交互动作
动画生成方法
矩阵
物体运动参数
动态调制机制
人体关节点坐标
关系
人体运动数据
注意力机制
序列
关键点特征
语义
文本编码器
姿态特征
系统为您推荐了相关专利信息
三维点云模型
倾斜路面
矫正方法
坐标
公路工程检测技术
指标检测方法
神经网络模型
光度
皮尔逊相关系数
波长