视频生成方法、深度学习模型的训练方法和装置

正文

推荐专利

申请号：CN202510338889

申请日期：2025-03-20

公开号：CN120220212A

公开日期：2025-06-27

类型：发明专利

摘要

本公开提供了一种视频生成方法、深度学习模型的训练方法、装置、电子设备和存储介质，涉及人工智能技术领域，尤其涉及计算机视觉、增强现实等技术领域，可应用于数字人等场景。具体实现方案为：将输入语音按照多个发音对象以及多个发音对象的发音顺序划分为多个子语音；针对每个子语音，根据子语音的语音特征和子语音所属对象的模板特征，确定子语音所属对象的关键点序列，关键点序列表征子语音所属对象发出子语音的唇形变化；以及根据多个子语音各自所属对象的关键点序列，生成目标视频。

技术关键词

模板特征深度学习模型对象语音特征面部关键点序列图像样本视频生成方法发音融合特征面部特征视频生成装置训练装置模块电子设备

系统为您推荐了相关专利信息

一种路面凹坑自动检测和深度估计方法、设备及存储介质

深度估计方法凹坑路面重建点云深度学习模型

基于影像链优化的线扫前臂双能X射线骨密度扫描系统

X射线源模块双能X射线线阵探测器图像处理模块数据处理模块

一种基于多源数据融合的降雨量测算方法

天气代表降雨量监测技术称重式雨量计翻斗式雨量计

智能药房数据处理方法、装置、设备和存储介质

智能药房数据处理方法对象通知概率密度函数

一种抗噪声增强的配电网电缆故障检测与定位方法

配电网电缆故障电缆故障检测高维特征向量深度学习模型定位方法

视频生成方法、深度学习模型的训练方法和装置

站点导航

APP 下载