一种数字人视频生成方法、设备及存储介质

正文

推荐专利

一种数字人视频生成方法、设备及存储介质

申请号：CN202510233748

申请日期：2025-02-28

公开号：CN120050483A

公开日期：2025-05-27

类型：发明专利

摘要

本公开涉及一种数字人视频生成方法、设备及存储介质，属于深度学习技术领域。通过接收音频信号以及参考人物图像；将音频信号输入到音频姿势序列对应关系学习模块中，输出音频信号对应的姿势序列数据；该学习模块采用已有讲话数字人视频帧预训练生成，姿势引导器采用预训练的姿势引导网络，仅对音频引导网络进行训练，训练过程中网络学习的目标为最小化所述音频引导器的输出与所述姿势引导器的输出之间的差异；将参考人物图像以及所述姿势序列数据输入到生成模型中，根据姿势序列数据依次生成视频帧；将生成的视频帧按时间顺序合成，输出数字人视频。本公开能够确保生成视频中的动作与驱动音频的一致性，有效保持人物形象的一致性。

技术关键词

视频生成方法姿势引导器音频特征视频帧序列网络图像视频生成设备信号交叉注意力机制语义特征数据融合特征解码器生成姿势音频编码器

系统为您推荐了相关专利信息

基于蛋白质语言模型的IL-4诱导肽预测方法及系统

深度学习模型序列过采样技术预测特征超参数调优方法

诊断信息的确定方法、装置、存储介质和电子设备

故障类别信息系统辅助检测方法编码向量语句

一种基于WSO-ELM网络模型的冰期流速预测方法

流速重构参数多普勒网络优化信号特征

机器人的技能仿真方法、装置、设备及存储介质

仿真环境关节仿真方法视觉仿真设备

基于人工智能的语音识别评估方法

指数数据样本集合文本发音语音识别系统

一种数字人视频生成方法、设备及存储介质

站点导航

APP 下载