摘要
本发明公开了基于语音同步的嘴形动作生成方法,属于语音同步技术领域,该生成方法具体步骤如下:Ⅰ:采集并预处理多组视频语料数据,同时建立包含生成模型与判别模型的对抗网络;Ⅱ:依据预处理后的视频语料数据,构造生成模型的输入,并通过生成模型获取各输入对应的预测图像;Ⅲ:依据预测图像,构造判别模型的输入,并通过判别模型判断真实视频与预测图像的差异;本发明能够提高语音嘴形同步的准确率,并且减少怪异嘴形状态的出现概率,实现了中文语音方面,更加准确的嘴形同步。
技术关键词
动作生成方法
语音特征
语音同步
动态图像序列
样本
实时语音
生成预测图像
视觉特征
视频帧
人脸检测算法
网络
画面
数据
中间层
注意力机制
系统为您推荐了相关专利信息
鲸鱼优化算法
煤气
BiLSTM模型
最佳参数组合
数据