通过声音中情绪实现视频中人物表情与唇形同步的方法及克隆数字人系统

正文

推荐专利

申请号：CN202510150775

申请日期：2025-02-11

公开号：CN120163906B

公开日期：2025-12-12

类型：发明专利

摘要

本发明公开了一种通过声音中情绪实现视频中人物表情与唇形同步的方法及克隆数字人系统，通过声音中情绪实现视频中人物表情与唇形同步的方法，采集音频信息并提取声音的多维度特征；应用预先训练好的表情与唇形生成模型根据声音的多维度特征生成对应的表情参数和唇形参数；对表情参数和唇形参数进行融合处理，并根据融合后的参数生成连续的动画序列；将连续的动画序列进行渲染，生成带有表情与唇形和声音情绪同步的视频信息。实现高度精准的表情与唇形同步，提升克隆数字人的自然逼真度，拓展克隆数字人的应用范围和价值。

技术关键词

模型训练模块子模块数据收集单元参数情感特征视频特征提取单元音频监督学习算法韵律特征降噪单元多维度特征提取面部唇形动画采集单元控制系统三维模型生成对抗网络深度学习算法

系统为您推荐了相关专利信息

一种基于自适应文本提示的zero-shot图像识别方法

提示方法预训练模型数据标签图像识别方法前馈神经网络

多模态档案文件自动化分类存储系统

分类存储系统视觉特征提取多模态信息解析单元边缘检测算法

一种人体姿态识别的方法、装置、设备及介质

人体姿态识别分类器模型核极限学习机特征提取模型降维特征

基于Transformer的驾驶习惯预测方法及装置

车辆行驶数据习惯数据标签训练集样本

一种基于多AI模型融合及参数优化的山洪预报方法

山洪预报方法山洪灾害集成学习模型时空卷积神经网络参数

通过声音中情绪实现视频中人物表情与唇形同步的方法及克隆数字人系统

站点导航

APP 下载