摘要
本发明提供了一种数字人生成方法、设备、程序产品及介质,属于人工智能技术领域,所述方法包括:生成目标文本信息对应的音频信息;按照预设图像序列的长度,对所述音频信息进行切分,获得至少两个音频帧序列,所述预设图像序列中的图像帧包含数字人形象;基于所述预设图像序列,并行处理所述至少两个音频帧序列,分别获得每个所述音频帧序列对应的数字人图像序列;对所述音频信息和所述至少两个音频帧序列分别对应的数字人图像序列进行合成处理,获得目标数字人视频。本发明实施例中,能够有效减少基于长文本生成数字人的时间,提高了处理效率,更好地满足了生产需求。
技术关键词
图像
序列
音频
人脸
生成方法
关键点
面部特征点
校正
处理器
可读存储介质
异步方式
人工智能技术
计算机程序产品
超分辨率
视频
坐标
文本
存储器
系统为您推荐了相关专利信息
巡检机器人
摄像头保护罩
摄像头外壳
接触式图像传感器
声控装置