视频生成方法和视频生成装置、电子设备、存储介质

正文

推荐专利

申请号：CN202511071622

申请日期：2025-07-30

公开号：CN120916028A

公开日期：2025-11-07

类型：发明专利

摘要

本申请实施例提供了一种视频生成方法和视频生成装置、电子设备、存储介质，涉及人工智能领域，应用于金融科技和医疗领域。该方法包括：获取视频生成场景对应的目标图像和视频配置数据，并对目标图像进行深度估计得到目标深度图；根据目标深度图和目标图像提取多尺度深度特征；根据视频配置数据和目标图像进行视频时序预测，得到时序预测特征；获取预设动态记忆库，预设动态记忆库包含与视频生成场景匹配的场景代表特征；根据场景代表特征、多尺度深度特征和时序预测特征进行特征融合，得到目标融合特征；对目标融合特征进行解码得到多个预测视频帧，并根据多个预测视频帧生成目标合成视频。本申请实施例能够提高生成视频的连贯性和自然度。

技术关键词

预测特征多尺度特征提取视频生成模型融合特征生成场景时序样本视频帧深度图视频生成装置视频生成方法图像注意力记忆偏移特征代表

系统为您推荐了相关专利信息

第三方服务访问方法、装置、设备及存储介质

服务访问方法分数预测模型注意力模型客户端访问第三方服务

一种变压器有载分接开关多通道振动信号融合特征提取方法

融合特征提取多通道有载分接开关 Lyapunov指数信号

基于多尺度特征与关联特征的中文短文本分类方法及系统

多尺度语义特征文本分类器词语多尺度特征 BERT模型

一种基于自然语言理解的多模态大语言模型对话生成方法

对话生成方法自然语言理解大语言模型多模态信息融合特征

一种多模态大模型的全自动标注方法及系统

多模态特征融合标注方法图片融合特征模块

视频生成方法和视频生成装置、电子设备、存储介质

站点导航

APP 下载