摘要
本发明涉及计算机图形学领域,具体公开了一种表情可控的人脸视频风格编辑方法;本发明将输出模块分为说话风格编码器ES、语音编码器EA、风格可控的表情动画解码器ED和视频渲染模块ER,使用人员可以通过输入模块输入目标说话人的参考图像I、驱动语音样本A和用于获取说话风格的参考视频片段V,语音编码器EA从语音中提取发音相关特征,通过说话风格编码器ES从给定的风格参考视频片段中提取说话过程中的个性化表情模式,通过风格可控的表情动画解码器ED合成指定风格的表情动画参数,最后通过视频渲染器ER将表情动画参数转化为说话视频,能够根据不同人的输入参数,生成不同风格的说话人视频,差异化表达不同人在相同情绪下的说话表情。
技术关键词
风格
编辑方法
语音编码器
人脸
语音特征
解码器
动画
输入模块
表情特征
输出模块
视频渲染器
计算机图形学
前馈神经网络
声学特征
样本
系统为您推荐了相关专利信息
分区
亮度均衡方法
数据
环境光照强度
色彩直方图