摘要
本发明提供了一种基于扩散模型的长人体运动序列生成方法,属于计算机视觉和计算机图形学技术领域。包括:构建长时人体动作数据集;构建长文本到长动作生成网络,所述长文本到长动作生成网络包括文本到短动作序列生成模型和运动序列拼接模型;所述文本到短动作序列生成模型采用变分自编码器与扩散模型结合框架,基于文本条件生成短时长人体动作序列;所述运动序列拼接模型实现动作序列的无缝拼接;利用长时人体动作数据集训练长文本到长动作生成网络;将长文本描述输入至训练完成的长文本到长动作生成网络得到与文本语义匹配的长人体运动序列。本发明有效解决片段过渡问题,从而实现长时间的人体动作生成。
技术关键词
序列生成方法
人体动作序列
人体动作数据
拼接模型
文本特征向量
过渡动作
交叉注意力机制
运动
文本编码器
计算机图形学技术
语义
无缝拼接
网络
编码器模块
噪声预测
系统为您推荐了相关专利信息
局部注意力机制
序列生成方法
生物信息技术
数据
深度学习模型
指令序列生成方法
强化学习模型
环境状态信息
多模态传感器
障碍物
运动生成方法
运动生成模型
人体运动数据
主导调节器
收集人体运动
TextRank算法
监测模块
数据安全机制
多模态信息融合
动态规划算法
指令反馈方法
无人机视觉
多模态
文本特征向量
无人机控制系统