一种基于姿势对抗网络的人脸视频生成方法及系统

正文

推荐专利

申请号：CN202410807403

申请日期：2024-06-21

公开号：CN118379777B

公开日期：2024-11-22

类型：发明专利

摘要

本发明公开了一种基于姿势对抗网络的人脸视频生成方法及系统，涉及图像处理技术领域，方法包括：构建人脸视频生成模型，包括图像编码器、音频编码器、头部运动预测模块、姿势编码器和解码器，所述人脸视频生成模型接收人脸图像和语音音频，生成人脸说话视频；获取训练数据集并对人脸视频生成模型进行预训练；构建唇型同步判别器作为判别器，对预训练人脸视频生成模型进行生成对抗训练；利用训练好的人脸视频生成模型实现人脸视频生成。本发明利用音频信号的动态特性对头部运动进行建模，并结合生成对抗网络与唇型同步判别器提高人脸视频的唇形同步精度，同时兼顾视频的逼真度，使得其更加真实、自然，从而为各种应用场景提供了更多的灵活性。

技术关键词

视频生成模型双向长短期记忆网络姿势音频编码器视频生成方法音频特征人脸图像提取图像编码器语音特征序列正面人脸模块视频生成系统运动

系统为您推荐了相关专利信息

基于参考视频的视频生成方法、装置、计算设备及介质

视频生成方法语音表情识别方法情感分析模型锚点

音频处理方法、智能设备及存储介质

信道冲击响应声学传感器智能设备所处环境声波发射装置答案

一种智能穿戴式骨盆姿态实时矫正方法及设备

矫正方法穿戴式智能腰带姿态特征提取特征金字塔网络

利用虚拟小键盘的基于手势的车辆进入系统

触摸点算术平均值轮廓车辆手势

一种能识别倾斜角度的儿童智能水杯

儿童智能水杯水杯主体电器元件按键模块加热模块

一种基于姿势对抗网络的人脸视频生成方法及系统

站点导航

APP 下载