一种基于RDDM的高质量说话人脸视频生成方法及系统

正文

推荐专利

申请号：CN202410941000

申请日期：2024-07-15

公开号：CN118488266B

公开日期：2024-09-17

类型：发明专利

摘要

本发明提供了一种基于RDDM的高质量说话人脸视频生成方法及系统，包括以下步骤：获取人脸参考图像、风格参考视频和音频片段；本发明通过获取人脸参考图像以及对应的风格参考视频和音频片段，对风格参考视频以及音频片段分别进行相应处理，得到对应的风格特征以及语音特征；然后将风格特征和语音特征输入到基于RDDM的解码器中，进行正向扩散和反向扩散得到预测的3D面部运动，使重建出的3D面部运动数据清晰无残差，准确的呈现出所需的面部表情细节和运动轨迹，最后，再通过图像渲染器将3D面部运动和参考图像作为输入来生成说话的面部，提高了说话人脸视频的生成质量和视觉效果。

技术关键词

视频生成方法语音特征面部运动数据人脸风格音频编码器 Word2Vec模型恢复面部噪声数据解码器识别工具图像视频生成系统注意力

系统为您推荐了相关专利信息

训练数据构建方法、装置、设备、存储介质和程序产品

遮挡人脸图像图像修复模型数据构建方法基础透明度

基于单张照片的全身重建方法

头部模型贴图顶点人脸纹理

基于特征增强预训练模型的有效语音检测方法、装置

预训练模型语音检测方法语音分类模型样本数据

一种配电系统的数字化虚实融合智慧电力实训方法、系统及介质

电力实训系统智能调控系统配电系统 OPCUA协议错误检测

一种AI直播跟踪旋转摄影灯及其使用方法

灯具壳体直播设备夹持板体控制终端补光灯

一种基于RDDM的高质量说话人脸视频生成方法及系统

站点导航

APP 下载