虚拟人配音图像生成方法、装置、设备及存储介质

正文

推荐专利

申请号：CN202510471866

申请日期：2025-04-15

公开号：CN120495132A

公开日期：2025-08-15

类型：发明专利

摘要

本发明提供一种虚拟人配音图像生成方法、装置、设备及存储介质，涉及计算机处理技术领域。该方法包括：获取源图像，获取驱动音频以及获取参考图像；对所述源图像、所述驱动音频和所述参考图像进行空间变形处理，生成虚拟人的脸部图像特征；对所述虚拟人的所述脸部图像特征进行修复处理，生成所述虚拟人的配音图像。本发明提供的实施例用以解决现有技术中生成的配音图像质量较差，噪声大的缺陷，实现通过对源图像、驱动音频和参考图像进行空间变形处理和唇部口型修复处理，有效减少生成过程中的模糊现象，提升配音图像的清晰度和细腻度，且进一步提高了音频与口型同步的准确性。

技术关键词

图像生成方法姿势音频特征变形特征图像生成装置处理器模糊现象计算机程序产品编码器网络存储器解码器电子设备模块噪声

系统为您推荐了相关专利信息

仿真软件功能调用方法及装置

指令仿真软件功能调用方法特征提取网络构建语音识别模型

一种基于强化学习的机械臂轨迹优化方法

机械臂机器人轨迹优化方法灰度扫描图像姿势关节

一种基于多源传感器的滑雪运动实时姿势识别反馈系统

姿势识别反馈系统中央处理器滑雪头盔机器学习模型

图像生成方法、装置、电子设备、计算机可读存储介质及计算机程序产品

纹理三维模型图像生成方法坐标染色

人脸鉴伪方法、装置、电子设备、存储介质及产品

鉴伪方法多模态特征视觉特征音频特征卷积模块

虚拟人配音图像生成方法、装置、设备及存储介质

站点导航

APP 下载