摘要
本发明提供了一种基于二次推理的数字人驱动方法、装置,涉及数字人技术领域,该方法首先通过固定参考帧推理,确保口型的稳定性和牙齿形态的一致性;其次利用滑动参考帧推理,动态调整人脸角度和背景,使生成的视频更加自然流畅;最后通过融合两次推理结果,进一步优化了数字人的视觉效果。此外,本方法还引入了异常帧跳过策略,能够自动检测并跳过视频中的异常帧,避免因异常帧导致的驱动错误,从而提高驱动的鲁棒性。旨在解决现有驱动方法口型动作在时间维度上存在不连贯性、人脸周边背景与整体画面不一致的问题。
技术关键词
驱动方法
人脸关键点检测
数据
人脸检测模型
音频编码器
图像编码器
深度学习模型
音频特征
滑动窗口
形态
视频帧
鲁棒性
解码器
表达式
数学
系统为您推荐了相关专利信息
模型建立方法
指标
企业业务发展
企业业务数据
业务系统
多智能体系统
数据生成方法
数据生成系统
决策
调用API接口
抽水蓄能机组
Adaboost算法
弱分类器
样本
集成学习模型
阿尔茨海默病诊断
门控循环单元
阿尔茨海默病患者
电信号
成分分析
功能袜
夹具模块
光纤传感模块
配重模块
数据处理模块