数字人视频生成方法、装置及计算机设备

正文

推荐专利

数字人视频生成方法、装置及计算机设备

申请号：CN202510932640

申请日期：2025-07-07

公开号：CN120807731A

公开日期：2025-10-17

类型：发明专利

摘要

本发明涉及数字人的技术领域，提供了数字人视频生成方法、装置及计算机设备，包括获取文本信息、音频信息以及风格控制参数，对文本信息和音频信息进行语义解析和特征提取，得到文本驱动表达特征和音频驱动表达特征后进行协同调制，得到面部表情参数序列和口型参数序列；基于风格控制参数生成数字人的风格化三维人脸模型，利用面部表情参数序列和口型参数序列对风格化三维人脸模型进行驱动，生成对应的数字人视频。通过文本信息和音频信息以及风格控制参数的协同调制，增强了在面部表情和口型的同步，提升了数字人视频生成的自然性和准确性，改善在处理复杂的语境和情感表达时，存在口型与面部表情无法完全同步的问题。

技术关键词

三维人脸模型视频生成方法动画序列面部文本语音特征提取风格参数音频特征韵律模式发音特征情绪特征计算机设备语义向量视频生成装置

系统为您推荐了相关专利信息

一种高血压预警模型、产品、计算机可读存储介质及其应用

标志物核苷酸风险序列引物探针组合

基于声学特征渲染XR化身

面部特征声学特征计算机可读非暂态存储介质机器学习模型客户端

一种多模态大模型构建方法以及大模型在线更新方法

模型构建方法在线更新方法预训练模型问答语料语言模块

命名实体的识别方法及装置、存储介质、电子设备

注意力跨度文本识别方法交互特征

一种员工异常风险监测方法及系统

风险评分模型员工风险监测方法风险监测系统数据采集模块

数字人视频生成方法、装置及计算机设备

站点导航

APP 下载