摘要
本申请公开一种乐器演奏的手部运动生成方法、装置及介质,方法包括:获取目标音频片段;将目标音频片段输入基本模型,利用音频细节提取器对目标音频片段进行提取,得到音频特征;利用手部位置预测器对音频特征进行手部位置预测,得到手部预测位置序列;将目标音频片段和手部预测位置序列输入手势生成器进行多步逆扩散处理,得到去噪手势特征,基于手部预测位置序列和所述去噪手势特征,得到基本模型输出的手部运动图。本申请能够提高手部运动图生成的准确性。
技术关键词
运动生成方法
音频特征
手势特征
乐器
序列
解码器
噪声样本
编码
生成装置
去噪模型
可读存储介质
速度
线性
计算机