视频生成方法、模型训练方法、装置及计算机程序产品

正文

推荐专利

申请号：CN202510538730

申请日期：2025-04-27

公开号：CN120658921A

公开日期：2025-09-16

类型：发明专利

摘要

本申请公开了一种视频生成方法、模型训练方法、装置及计算机程序产品，视频生成方法包括：获取用于生成视频的目标音频以及参考图片，参考图片中包括发声对象；根据目标音频对应的一个或多个音频片段的片段特征以及参考图像，确定音频片段对应的各待生成视频帧的全局视觉特征；根据目标音频各音频帧的发音特征以及参考图片中发声对象的唇部特征，确定音频帧对应的待生成视频帧中发声对象的唇部特征；根据待生成视频帧对应的唇部特征和全局视觉特征，生成各视频帧。通过本申请提供的方案既能够使得所生成的视频中人物的表达更加生动自然，也能够很准确地使得唇部动作和音频同步，提高用户的视觉体验。

技术关键词

全局视觉特征唇部特征音频视频生成方法发声发音特征视频帧视频生成模型对象图片样本计算机程序产品模型训练方法图像脸部特征视频生成装置关键点基础

系统为您推荐了相关专利信息

一种服装定制化订单的处理方法及系统

订单协议物料需求量语音特征数据终端

一种基于言语和生理特征对对话情绪进行实时分析的系统

音频采集模块生理情绪识别模型情绪特征光学检测器

一种电子节目指南生成方法、装置、设备和介质

节目特征偏好特征生成电子节目指南兴趣文本分析模型

基于WebAssembly的电动车动态功能更新系统

功能更新系统 MQTT协议动态车载传感器音频系统控制

适用于复杂环境下的音频数据增强方法及系统

序列语音音频数据处理技术频段噪声

视频生成方法、模型训练方法、装置及计算机程序产品

站点导航

APP 下载