摘要
本发明涉及计算机视觉技术领域,公开了一种虚拟数字人音唇同步优化方法、装置、设备及存储介质。虚拟数字人音唇同步优化方法包括:获取下一时刻虚拟数字人待输出的目标音频片段;判断目标音频片段是否属于待处理的音频类型;若目标音频片段属于待处理的音频类型,则基于预置音唇同步优化策略,生成目标音频片段对应的3D人脸嘴型参数帧序列;基于3D人脸嘴型参数帧序列,生成对应3D人脸嘴型图像帧序列并渲染至虚拟数字人中。本发明能够适应各类音频类型,提升了虚拟数字人在不同音频类型下的嘴型流畅性与自然性。
技术关键词
拓扑结构信息
人脸模型
序列
顶点
音频优化单元
参数
音唇同步
滤波算法
计算机设备
优化装置
计算机视觉技术
标签
可读存储介质
语义
图像
时序
模块
存储器
系统为您推荐了相关专利信息
稀疏贝叶斯学习
分辨率
传声器
超参数
迭代估计方法
智能供电管理方法
功率分配策略
统计特征
切片
数据