虚拟人配音图像生成方法、装置、设备及存储介质

AITNT
正文
推荐专利
虚拟人配音图像生成方法、装置、设备及存储介质
申请号:CN202510471866
申请日期:2025-04-15
公开号:CN120495132A
公开日期:2025-08-15
类型:发明专利
摘要
本发明提供一种虚拟人配音图像生成方法、装置、设备及存储介质,涉及计算机处理技术领域。该方法包括:获取源图像,获取驱动音频以及获取参考图像;对所述源图像、所述驱动音频和所述参考图像进行空间变形处理,生成虚拟人的脸部图像特征;对所述虚拟人的所述脸部图像特征进行修复处理,生成所述虚拟人的配音图像。本发明提供的实施例用以解决现有技术中生成的配音图像质量较差,噪声大的缺陷,实现通过对源图像、驱动音频和参考图像进行空间变形处理和唇部口型修复处理,有效减少生成过程中的模糊现象,提升配音图像的清晰度和细腻度,且进一步提高了音频与口型同步的准确性。
技术关键词
图像生成方法 姿势 音频特征 变形特征 图像生成装置 处理器 模糊现象 计算机程序产品 编码器 网络 存储器 解码器 电子设备 模块 噪声
系统为您推荐了相关专利信息
1
仿真软件功能调用方法及装置
指令 仿真软件 功能调用方法 特征提取网络 构建语音识别模型
2
一种基于强化学习的机械臂轨迹优化方法
机械臂机器人 轨迹优化方法 灰度扫描图像 姿势 关节
3
一种基于多源传感器的滑雪运动实时姿势识别反馈系统
姿势识别 反馈系统 中央处理器 滑雪头盔 机器学习模型
4
图像生成方法、装置、电子设备、计算机可读存储介质及计算机程序产品
纹理 三维模型 图像生成方法 坐标 染色
5
人脸鉴伪方法、装置、电子设备、存储介质及产品
鉴伪方法 多模态特征 视觉特征 音频特征 卷积模块
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号