摘要
本发明提供一种情感可控脸部动画生成方法、装置、设备及介质,该方法包括:确定目标时间段内的脸部视频和音频,所述脸部视频和所述音频同步采集;根据所述脸部视频和所述音频,确定条件编码,所述条件编码表征脸部视频中情感编码和音频中声音编码的组合关系;根据所述条件编码,确定隐空间编码,所述隐空间编码表征动画场景下的情感编码;根据所述隐空间编码,确定目标时间段内的人脸模型参数;根据所述人脸模型参数和预配置的视角参数,确定动画场景下的脸部视频,能够通过声音和情感生成三维人脸动画,能够更加灵活地控制动画生成结果。
技术关键词
人脸模型
动画生成方法
视频
音频编码器
参数估计算法
时间段
深度网络模型
图像
非暂态计算机可读存储介质
视角
三维人脸动画
多层感知机
编解码器
场景
语音特征提取
系统为您推荐了相关专利信息
大型船舶
航行方法
典型
三维场景可视化
视频采集设备
建筑信息模型
装配式建筑施工
多源异构数据
资源分配
数据可视化
信息分析方法
监控视频流
运动特征参数
空间金字塔池化
深度学习模型