一种文生视频生成方法、产品、设备及存储介质

正文

推荐专利

申请号：CN202510406455

申请日期：2025-04-02

公开号：CN119946378B

公开日期：2025-06-20

类型：发明专利

摘要

本申请公开了一种文生视频生成方法、产品、设备及存储介质，涉及人工智能技术领域，包括：将文本描述和噪声向量输入至按照预设蒸馏策略训练的第一文生视频模型，以生成与文本描述匹配的视频和相应的视频隐向量；预设蒸馏策略为利用学生模型和基于注意力机制的扩散模型依次对历史高分辨率视频进行去噪，并基于去噪结果对应的损失对预设学生模型的模型参数进行更新；对视频隐向量进行上采样，并对得到的采样后向量和噪声向量进行拼接；将拼接后向量输入至基于多路状态空间模型的第二文生视频模型，以生成目标文生视频。本申请在基于注意力机制的基础上结合多路状态空间模型，通过多次推理，可提高文生视频的分辨率以及文生视频的生成效率。

技术关键词

视频生成方法状态空间模型输出特征文本多层感知器学生注意力机制蒸馏噪声处理单元编码上采样视频解码器超参数可读存储介质存储计算机程序梯度下降法人工智能技术教师

系统为您推荐了相关专利信息

一种基于联邦学习和知识图谱的痛风病分期预测方法、系统及存储介质

GCN模型图谱深度前馈神经网络服务端深度学习网络模型

基于多模态语义融合的全景图像质量评价方法和装置

局部视觉语义多模态语义特征提取全景图注意力

一种基于通用大模型的电力营销稽查工单政策依据生成方法及系统

电力营销稽查依存句法分析文本依存句法树生成方法

一种基于大语言模型的BIM可视化安全技术交底方法

交底方法大语言模型建筑模型可视化技术项目

一种医保参保信息查询系统

信息查询系统网络安全监测关联规则分析构建预测模型数据分析模块

一种文生视频生成方法、产品、设备及存储介质

站点导航

APP 下载