摘要
本申请提供一种数字人图像生成方法、装置、设备及可读存储介质,所述方法通过模型驱动生成匹配驱动语音数据的多帧中间图像,并通过预先训练的牙齿生成网络结合中间图像之前完成牙齿重建的前K帧修正图像,对当前帧中间图像进行牙齿重建,并通过中间图像上牙齿区域的遮罩处理,根据遮罩图像将中间图像对应的修正图像与该中间图像进行融合,在保证了中间图像上面部表情与唇部口型与驱动语音数据的一致性匹配的同时,实现了对中间图像上牙齿区域的优化,使得数字人的牙齿在视觉上更加清晰、逼真,呈现出自然、合理的排列状态,提升了数字人的整体真实感。
技术关键词
图像生成方法
网络
样本
图像生成装置
融合特征
像素点
存储计算机程序
关键点
语音
面部
注意力机制
处理器
真实感
可读存储介质
模块
轮廓
存储器
数据
系统为您推荐了相关专利信息
预警方法
轮轴
烟雾
动态背景建模技术
危险品车辆监控
细粒度分类
阶段
多层次信息融合
加权特征
随机梯度下降