一种基于深度学习的视频人物口型同步方法

正文

推荐专利

一种基于深度学习的视频人物口型同步方法

申请号：CN202510551523

申请日期：2025-04-29

公开号：CN120472053A

公开日期：2025-08-12

类型：发明专利

摘要

本发明属于计算机视觉与人工智能技术领域，具体涉及一种基于深度学习的视频人物口型同步方法。该方法通过多模态特征融合、生成对抗网络(GAN)及可微分渲染技术，实现高精度、低延迟的唇部动作生成，适用于影视后期制作、虚拟现实(VR)实时交互、语音驱动动画生成以及多语言视频翻译等场景，该方法在标准数据集上同步误差降低62.5％，支持30fps实时处理，并具备强噪声鲁棒性与多语种适应性，可广泛应用于影视制作、虚拟现实及实时交互场景。

技术关键词

同步方法生成对抗网络视频融合声学特征关键点影视后期制作卷积神经网络提取多模态特征融合视觉特征注意力机制损失函数优化噪声鲁棒性输入模块双线性插值渲染技术人工智能技术同步误差音频特征

一种基于深度学习的视频人物口型同步方法

站点导航

APP 下载