视频生成的方法、装置、电子设备、存储介质和产品

正文

推荐专利

申请号：CN202510950445

申请日期：2025-07-10

公开号：CN120455800A

公开日期：2025-08-08

类型：发明专利

摘要

本公开实施例公开了一种视频生成的方法、装置、电子设备、存储介质和产品，方法包括：确定引导图像的图像特征和提示文本的文本特征，基于图像特征、文本特征和预设噪声，利用预先训练的视频生成模型进行预设个时间步的去噪处理，确定目标视频，视频生成模型中的交叉注意力模块包括查询特征映射层、文本键特征映射层、文本值特征映射层、图像键特征映射层和图像值特征映射层，在每个时间步的去噪处理中：交叉注意力模块对图像特征、文本特征、预设噪声进行交叉注意力计算得到交叉注意力输出，以便基于每个时间步的去噪处理以及每个时间步的交叉注意力输出确定所述目标视频。由此提高了生成的目标视频与用户需要之间的匹配度，提升了用户体验。

技术关键词

键特征视频生成模型查询特征标签文本融合特征交叉注意力机制噪声计算机程序指令样本图像特征提取电子设备存储计算机程序特征提取模块计算机程序产品

系统为您推荐了相关专利信息

一种基于细粒度模态关系感知网络的视频片段检索方法

视频片段检索方法查询特征文本关系网络

一种用于探测雷达的FOD防护系统、方法及工具箱

雷达防护方法时间段运动轨迹信息预警模型

一种慢性病患者抑郁风险预测方法

风险预测方法抑郁序列数学模型融合特征

一种基于社区感知的脑疾病分类方法

感兴趣功能磁共振成像更新模型参数样本节点特征

一种结合深度学习与物理特征参数的地震烈度快速产出方法、装置、电子设备

物理特征参数分支波形深度学习模型高维特征向量

视频生成的方法、装置、电子设备、存储介质和产品

站点导航

APP 下载