一种基于二次推理的数字人驱动方法、装置

正文

推荐专利

一种基于二次推理的数字人驱动方法、装置

申请号：CN202510364334

申请日期：2025-03-26

公开号：CN120355825A

公开日期：2025-07-22

类型：发明专利

摘要

本发明提供了一种基于二次推理的数字人驱动方法、装置，涉及数字人技术领域，该方法首先通过固定参考帧推理，确保口型的稳定性和牙齿形态的一致性；其次利用滑动参考帧推理，动态调整人脸角度和背景，使生成的视频更加自然流畅；最后通过融合两次推理结果，进一步优化了数字人的视觉效果。此外，本方法还引入了异常帧跳过策略，能够自动检测并跳过视频中的异常帧，避免因异常帧导致的驱动错误，从而提高驱动的鲁棒性。旨在解决现有驱动方法口型动作在时间维度上存在不连贯性、人脸周边背景与整体画面不一致的问题。

技术关键词

驱动方法人脸关键点检测数据人脸检测模型音频编码器图像编码器深度学习模型音频特征滑动窗口形态视频帧鲁棒性解码器表达式数学

系统为您推荐了相关专利信息

一种数据统一业务口径模型建立方法

模型建立方法指标企业业务发展企业业务数据业务系统

一种基于多智能体大语言模型的数据生成方法及系统

多智能体系统数据生成方法数据生成系统决策调用API接口

一种抽水蓄能机组可靠性等级预测方法及系统

抽水蓄能机组 Adaboost算法弱分类器样本集成学习模型

基于脑电信号通道选择和门控循环单元的阿尔茨海默病辅助检测系统及方法

阿尔茨海默病诊断门控循环单元阿尔茨海默病患者电信号成分分析

一种多点位动态拉伸的功能袜压力测量装置和系统

功能袜夹具模块光纤传感模块配重模块数据处理模块

一种基于二次推理的数字人驱动方法、装置

站点导航

APP 下载