摘要
本申请属于金融科技技术领域,提供了一种说话人脸视频生成处理方法、装置及相关设备,为了解决传统技术中说话人脸视频生成的真实性较低的问题,通过确定生成说话人脸视频所需的说话人物对应的语音与目标人物源图像,并确定语音对应的第一音频特征序列,及确定目标人物源图像对应的第一人脸图像特征集合,且确定若干对第二音频特征与第二人脸图像特征之间的对应关系,基于上述来生成第一音频特征序列相对应的目标人脸图像序列,最后根据语音与目标人脸图像序列,生成说话人物相对应的说话人脸视频,能够提高说话人脸视频生成的真实性,例如,在金融领域,能够实现业务员本人出境且本人配音的视频生成,能够提高生成的业务员视频的真实性。
技术关键词
人脸图像特征
人脸图像序列
图像生成模型
样本
视频
生成人脸图像
人脸检测模型
梅尔频率倒谱系数
音频特征提取
语音
关系
人脸特征
金融科技技术
计算机设备
存储计算机程序
重构
系统为您推荐了相关专利信息
音频识别模块
图像识别模块
通讯控制模块
中央处理器
移动监控装置
图形化编程方法
图形化编程平台
视频帧
图像
图形化编程装置
图像检索模型
深度度量学习
嵌入特征
无监督
矩阵