摘要
本公开提供了一种视频生成方法、深度学习模型的训练方法、装置、电子设备和存储介质,涉及人工智能技术领域,尤其涉及计算机视觉、增强现实等技术领域,可应用于数字人等场景。具体实现方案为:将输入语音按照多个发音对象以及多个发音对象的发音顺序划分为多个子语音;针对每个子语音,根据子语音的语音特征和子语音所属对象的模板特征,确定子语音所属对象的关键点序列,关键点序列表征子语音所属对象发出子语音的唇形变化;以及根据多个子语音各自所属对象的关键点序列,生成目标视频。
技术关键词
模板特征
深度学习模型
对象
语音特征
面部关键点
序列
图像
样本
视频生成方法
发音
融合特征
面部特征
视频生成装置
训练装置
模块
电子设备
系统为您推荐了相关专利信息
X射线源模块
双能X射线
线阵探测器
图像处理模块
数据处理模块
天气
代表
降雨量监测技术
称重式雨量计
翻斗式雨量计
配电网电缆故障
电缆故障检测
高维特征向量
深度学习模型
定位方法