摘要
本申请公开了一种侧身行走数字人视频生成方法、设备及介质,属于数字人生成的技术领域。方法包括:获取训练数据集;对训练数据集进行头颈关键点检测与标注,并基于关键点截取多个全身视频帧,以生成待训练视频;基于预设的NeRF模型处理待训练视频,以生成预训练的NeRF模型;获取待推理语音,并将待推理语音输入至预训练的NeRF模型,以生成与待推理语音匹配的头颈视频;其中,面部头颈视频包括多个视频帧;获取待推理语音,并将待推理语音输入至预训练的NeRF模型,以生成与待推理语音匹配的头颈视频;将多个头颈视频帧贴回多个全身视频帧,以生成侧身行走的数字人视频。本申请通过上述方法能够在动态行走场景中,实现数字人头部与身体自然的衔接。
技术关键词
视频帧
视频生成方法
头颈
像素点
语音特征
融合算法
计算机可执行指令
关键点检测算法
坐标
视频生成设备
姿势
动画
动态
数据
面部特征点
系统为您推荐了相关专利信息
客服系统
长短期记忆网络
语音分类模型
语音语义识别
卷积神经网络特征
多光谱卫星影像
作物识别方法
多光谱遥感图像
样本
像素点
三维图像重建方法
中子源
EM算法
矩阵
图像诊断方法