情感说话头视频生成模型训练方法及系统

正文

推荐专利

情感说话头视频生成模型训练方法及系统

申请号：CN202510508689

申请日期：2025-04-22

公开号：CN120374813A

公开日期：2025-07-25

类型：发明专利

摘要

本发明公开了一种情感说话头视频生成模型训练方法及系统，包括，S1、获取视频训练集，对视频训练集进行预处理得到视频源图、源音频和视频源图的头部姿态；S2、将视频源图、源音频和视频源图的头部姿态输入情感说话头视频生成模型得到情感说话头视频；S3、基于情感说话头视频和视频训练集进行损失函数计算，反向优化情感说话头视频生成模型；S4、执行步骤S1到S3，直到损失函数最小输出最优情感说话头视频生成模型。本发明可以实现情感说话头视频情感准确表达。

技术关键词

视频生成模型表达序列训练集变形特征人脸关键点声学特征深度图音频解码器语音特征面部融合特征语音编码器输入模块文本编码器图像编码器

系统为您推荐了相关专利信息

一种微地图文本内容的敏感信息智能判别方法

智能判别方法文本合规性地理信息工程敏感信息识别

一种演化LSTM的信道估计方法、程序、设备及存储介质

信道估计模型信道估计方法超参数分子正交频分复用系统

基于超平面引导式重采样方法的家用电器故障诊断方法

故障诊断方法家用电器样本采样方法多头注意力机制

确定堆芯参数的方法

堆芯组件卷积神经网络模型数据验证六角形参数

基于决策树模型的供电方案编制业务规则的表示方法及系统

CART决策树决策树模型分类决策树超参数剪枝方式

情感说话头视频生成模型训练方法及系统

站点导航

APP 下载