基于预训练特征与头部稳定模块的说话数字人生成方法

正文

推荐专利

申请号：CN202510040899

申请日期：2025-01-10

公开号：CN120128765A

公开日期：2025-06-10

类型：发明专利

摘要

本发明公开了一种基于预训练特征与头部稳定模块的说话数字人生成方法，构建说话数字人生成模型，提取语音帧的语音特征和参考视频帧的表情特征，提取参考视频帧的头部姿势，从参考视频帧提取脸部图像和嘴部图像并分别得到对应的高斯基元，根据脸部分支的高斯基元、语音特征和表情特征得到脸部分支的逐点变形参数，根据嘴部分支的高斯基元和语音特征和和嘴部分支的逐点变形参数，渲染得到脸部图像和嘴部图像后融合生成说话数字人视频，采用训练样本集对说话数字人生成模型进行训练，用训练好的说话数字人生成模型根据输入的语音和参考视频生成说话数字人视频。本发明对语音编码方法和头部姿势获取方法进行改进，从而提高生成说话数字人视频的质量。

技术关键词

特征提取模块语音特征基元视频稳定调节器表情特征生成方法面部关键点语音编码器分支编码模块通用特征融合特征训练特征图像分割跟踪器姿势

系统为您推荐了相关专利信息

基于多模态面部特征融合的康养陪伴机器人

面部特征融合陪伴机器人编码向量序列注意力

一种在线辅助语音对话场景的多模态情感提示方法及系统

提示方法融合特征交叉注意力机制标签场景

一种基于知识蒸馏超轻网络的路基缺陷在线智能检测方法

在线智能检测方法震动传感器阵列神经网络模型特征提取网络特征提取模块

车辆控制系统、方法和智能车辆

危险源监测装置整车控制装置智能车辆车辆控制系统路径规划装置

基于大数据冗余分析的安防监控信息存储系统及方法

安防监控信息安防监控视频存储服务器大数据特征提取算法

基于预训练特征与头部稳定模块的说话数字人生成方法

站点导航

APP 下载