一种基于音频驱动的面部多帧动态融合实现方法

正文

推荐专利

申请号：CN202510358265

申请日期：2025-03-25

公开号：CN120451343A

公开日期：2025-08-08

类型：发明专利

摘要

本发明公开了一种基于音频驱动的面部多帧动态融合实现方法，涉及面部多帧动态融合技术领域，包括人脸运动序列生成方法和人脸视频生成方法，人脸运动序列生成方法包括以下步骤：输入一段参考音频、一段参考视频和一段驱动音频；从所述参考视频中提取人物的面部表情和头部运动信息；从所述参考音频和驱动音频中提取语音的语义和声学特征；利用多帧动态融合的方法，将提取的面部表情和头部运动信息与语音的语义和声学特征结合起来。该基于音频驱动的面部多帧动态融合实现方法，通过将学习到的说话风格与输入的驱动音频相结合，能够生成逼真自然的面部表情和头部运动。

技术关键词

序列生成方法声学特征人脸视频生成方法动态运动面部关键点音频特征语义风格图像识别算法信号处理技术深度学习模型语音特征

系统为您推荐了相关专利信息

一种基于深度学习的图像去反光方法

图像去反光数据训练神经网络人脸神经网络模型三通道

基于模糊算法的混合储能系统功率分配方法、介质、设备

超级电容器混合储能系统模糊算法低通滤波器电压

一种考虑路面附着条件的智能车队协同控制方法

智能车队协同控制方法加速度运动控制器分配控制器

一种动态分层分区调频控制方法

调频控制方法分区关键断面动态电网拓扑结构

一种基于词嵌入相似性的词库动态扩充与ESG表现量化评估方法

量化评估方法训练集数据 word2vec模型非结构化文本企业

一种基于音频驱动的面部多帧动态融合实现方法

站点导航

APP 下载