摘要
本申请实施例提供一种动作合成方法,包括:对视频序列进行检测得到关键点序列,并进行可视化处理与人体骨架对齐,以获取初步骨架序列;采用扩散概率模型,对所述关键点序列按照时间叠加不同程度的高斯噪声,其中时间越长,填加的高斯噪声越多;和将加噪的所述关键点序列作为条件,在语义特征的引导下,采用所述扩散概率模型预测噪声,去噪后得到最终骨架序列。本申请实施例提供的动作合成方法通过扩散概率模型的引入以及语音语义等条件的嵌入,能够提高人体动作合成的鲁棒性。本申请实施例还提供一种动作合成装置和电子设备。
技术关键词
关键点
序列
语义特征
人体骨架
噪声
音频特征
编码
线性
视频
电子设备
可读存储介质
频谱特征
语义向量
处理器
存储器
鲁棒性
计算机
模块