一种文生视频生成方法、产品、设备及存储介质

AITNT
正文
推荐专利
一种文生视频生成方法、产品、设备及存储介质
申请号:CN202510406455
申请日期:2025-04-02
公开号:CN119946378B
公开日期:2025-06-20
类型:发明专利
摘要
本申请公开了一种文生视频生成方法、产品、设备及存储介质,涉及人工智能技术领域,包括:将文本描述和噪声向量输入至按照预设蒸馏策略训练的第一文生视频模型,以生成与文本描述匹配的视频和相应的视频隐向量;预设蒸馏策略为利用学生模型和基于注意力机制的扩散模型依次对历史高分辨率视频进行去噪,并基于去噪结果对应的损失对预设学生模型的模型参数进行更新;对视频隐向量进行上采样,并对得到的采样后向量和噪声向量进行拼接;将拼接后向量输入至基于多路状态空间模型的第二文生视频模型,以生成目标文生视频。本申请在基于注意力机制的基础上结合多路状态空间模型,通过多次推理,可提高文生视频的分辨率以及文生视频的生成效率。
技术关键词
视频生成方法 状态空间模型 输出特征 文本 多层感知器 学生 注意力机制 蒸馏 噪声 处理单元 编码 上采样 视频解码器 超参数 可读存储介质 存储计算机程序 梯度下降法 人工智能技术 教师
系统为您推荐了相关专利信息
1
一种基于联邦学习和知识图谱的痛风病分期预测方法、系统及存储介质
GCN模型 图谱 深度前馈神经网络 服务端 深度学习网络模型
2
基于多模态语义融合的全景图像质量评价方法和装置
局部视觉语义 多模态 语义特征提取 全景图 注意力
3
一种基于通用大模型的电力营销稽查工单政策依据生成方法及系统
电力营销稽查 依存句法分析 文本 依存句法树 生成方法
4
一种基于大语言模型的BIM可视化安全技术交底方法
交底方法 大语言模型 建筑模型 可视化技术 项目
5
一种医保参保信息查询系统
信息查询系统 网络安全监测 关联规则分析 构建预测模型 数据分析模块
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号