一种音脸同步视频生成方法、装置、电子设备及存储介质

AITNT
正文
推荐专利
一种音脸同步视频生成方法、装置、电子设备及存储介质
申请号:CN202410879296
申请日期:2024-07-02
公开号:CN118646939A
公开日期:2024-09-13
类型:发明专利
摘要
本发明提供的一种音脸同步视频生成方法、装置、电子设备及存储介质,所述方法通过将视频数据分离出用于训练的所述音频数据,以及用于对照的所述视频图像数据,并视频图像数据中获取原始数据,通过所述音频数据获取预测人脸的顶点信息,根据所述原始信息和所述预测脸部的顶点信息渲染预测3D对象脸部,在训练的过程中将所述预测3D对象脸部与原始脸部进行形状损失计算。与现有技术相比,渲染得到的所述预测3D对象脸部直观地包含了所述预测脸部的顶点的形状、位置和颜色,本发明通过计算所述形状损失,能够提高所述脸部重构模型捕捉微妙的表情变化,进一步提高预测的精度以及生成视频的同步率。
技术关键词
视频生成方法 顶点 对象 数据 音频 重构模型 构建脸部 图像 计算机可读指令 视频生成装置 视频采集模块 电子设备 计算机存储介质 纹理 参数 贴图 网络
系统为您推荐了相关专利信息
1
一种基于自适应运动预测与表观学习的多目标跟踪方法
特征学习网络 分支 跟踪方法 轨迹特征 时序
2
一种数据重复度校验方法
校验方法 数据 校验技术 Hash算法 指数衰减函数
3
一种运维预测与自修复方法、系统、设备及存储介质
动态知识图谱 修复方法 神经网络模型 性能指标数据 深度图
4
基于事件引擎的推荐客户的方法、装置、介质和程序产品
线索 客户 特征值 展示页面 控件
5
一种基于意图识别和知识推送的人机交互设计方法及装置
人机交互设计方法 LSTM模型 意图识别 模型超参数 曲柄滑块机构
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号