摘要
本发明提供一种虚拟人配音图像生成方法、装置、设备及存储介质,涉及计算机处理技术领域。该方法包括:获取源图像,获取驱动音频以及获取参考图像;对所述源图像、所述驱动音频和所述参考图像进行空间变形处理,生成虚拟人的脸部图像特征;对所述虚拟人的所述脸部图像特征进行修复处理,生成所述虚拟人的配音图像。本发明提供的实施例用以解决现有技术中生成的配音图像质量较差,噪声大的缺陷,实现通过对源图像、驱动音频和参考图像进行空间变形处理和唇部口型修复处理,有效减少生成过程中的模糊现象,提升配音图像的清晰度和细腻度,且进一步提高了音频与口型同步的准确性。
技术关键词
图像生成方法
姿势
音频特征
变形特征
图像生成装置
处理器
模糊现象
计算机程序产品
编码器
网络
存储器
解码器
电子设备
模块
噪声
系统为您推荐了相关专利信息
指令
仿真软件
功能调用方法
特征提取网络
构建语音识别模型
机械臂机器人
轨迹优化方法
灰度扫描图像
姿势
关节
姿势识别
反馈系统
中央处理器
滑雪头盔
机器学习模型
鉴伪方法
多模态特征
视觉特征
音频特征
卷积模块