说话人脸视频生成处理方法、装置及相关设备

AITNT
正文
推荐专利
说话人脸视频生成处理方法、装置及相关设备
申请号:CN202411508032
申请日期:2024-10-25
公开号:CN119516052A
公开日期:2025-02-25
类型:发明专利
摘要
本申请属于金融科技技术领域,提供了一种说话人脸视频生成处理方法、装置及相关设备,为了解决传统技术中说话人脸视频生成的真实性较低的问题,通过确定生成说话人脸视频所需的说话人物对应的语音与目标人物源图像,并确定语音对应的第一音频特征序列,及确定目标人物源图像对应的第一人脸图像特征集合,且确定若干对第二音频特征与第二人脸图像特征之间的对应关系,基于上述来生成第一音频特征序列相对应的目标人脸图像序列,最后根据语音与目标人脸图像序列,生成说话人物相对应的说话人脸视频,能够提高说话人脸视频生成的真实性,例如,在金融领域,能够实现业务员本人出境且本人配音的视频生成,能够提高生成的业务员视频的真实性。
技术关键词
人脸图像特征 人脸图像序列 图像生成模型 样本 视频 生成人脸图像 人脸检测模型 梅尔频率倒谱系数 音频特征提取 语音 关系 人脸特征 金融科技技术 计算机设备 存储计算机程序 重构
系统为您推荐了相关专利信息
1
一种具有预警功能的监控电力系统及其使用方法
音频识别模块 图像识别模块 通讯控制模块 中央处理器 移动监控装置
2
一种语音驱动的动态三维人脸和动态纹理生成方法和系统
动态纹理生成方法 贴图 音频特征 风格 编码器
3
适用于长大坡道高速列车制动闸片状态监控的自适应网络学习方法
网络学习方法 列车制动闸片 样本 分类器 坡道
4
基于手势识别的AI图形化编程方法及系统
图形化编程方法 图形化编程平台 视频帧 图像 图形化编程装置
5
一种基于无监督深度度量学习的细粒度图像检索方法
图像检索模型 深度度量学习 嵌入特征 无监督 矩阵
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号