摘要
本发明提供了一种多模态人像视频编辑方法,可以应用于视频编辑技术领域。该方法包括:给定人像视频,预处理得到相机参数,人体身份、表情、姿态系数、人体语义分割图和二维人像遮罩;基于神经高斯纹理机制,将可学习的三维高斯特征嵌入到参数化人体几何表面上,使用神经渲染器将三维高斯泼溅特征图转化为图像,通过视频的RGB和分割图信息,优化重建三维人像;使用迭代数据集更新技术,将多模态二维图像生成模型的知识蒸馏到三维人像编辑中,使用表情相似性引导和面部感知人像编辑模型,提升了编辑质量。该方法将二维编辑任务提升至三维,具有良好的三维一致性和时域一致性。通过多模态生成模型的知识,可以实现高质量人像视频编辑功能。
技术关键词
视频编辑方法
多模态
视频帧
图像生成模型
图像处理模型
人体
动态
视频编辑技术
纹理
参数
身份
语义
蒸馏
阶段
面部
相机
系统为您推荐了相关专利信息
解码方法
语义
编码器
sigmoid函数
时序特征
编码特征
图像篡改定位方法
边界先验
融合特征
层级
实时处理器
驾驶控制系统
功能模块
并行计算单元
车型