说话人脸视频生成处理方法、装置及相关设备

正文

推荐专利

申请号：CN202411508032

申请日期：2024-10-25

公开号：CN119516052A

公开日期：2025-02-25

类型：发明专利

摘要

本申请属于金融科技技术领域，提供了一种说话人脸视频生成处理方法、装置及相关设备，为了解决传统技术中说话人脸视频生成的真实性较低的问题，通过确定生成说话人脸视频所需的说话人物对应的语音与目标人物源图像，并确定语音对应的第一音频特征序列，及确定目标人物源图像对应的第一人脸图像特征集合，且确定若干对第二音频特征与第二人脸图像特征之间的对应关系，基于上述来生成第一音频特征序列相对应的目标人脸图像序列，最后根据语音与目标人脸图像序列，生成说话人物相对应的说话人脸视频，能够提高说话人脸视频生成的真实性，例如，在金融领域，能够实现业务员本人出境且本人配音的视频生成，能够提高生成的业务员视频的真实性。

技术关键词

人脸图像特征人脸图像序列图像生成模型样本视频生成人脸图像人脸检测模型梅尔频率倒谱系数音频特征提取语音关系人脸特征金融科技技术计算机设备存储计算机程序重构

系统为您推荐了相关专利信息

一种具有预警功能的监控电力系统及其使用方法

音频识别模块图像识别模块通讯控制模块中央处理器移动监控装置

一种语音驱动的动态三维人脸和动态纹理生成方法和系统

动态纹理生成方法贴图音频特征风格编码器

适用于长大坡道高速列车制动闸片状态监控的自适应网络学习方法

网络学习方法列车制动闸片样本分类器坡道

基于手势识别的AI图形化编程方法及系统

图形化编程方法图形化编程平台视频帧图像图形化编程装置

一种基于无监督深度度量学习的细粒度图像检索方法

图像检索模型深度度量学习嵌入特征无监督矩阵

说话人脸视频生成处理方法、装置及相关设备

站点导航

APP 下载