摘要
本公开实施例公开了基于多视频片段生成视频的方法、装置、设备、介质,方法包括:将待生成视频对应的多个目标视频设置到预设模板视频中,得到初始视频;将预设噪声信息、初始视频和待生成视频对应的文本信息输入到预先训练的视频生成模型中,由视频生成模型中的适配器网络模块对初始视频进行处理,得到由适配器网络模块中各第一网络层输出的第一向量,由视频生成模型中的视频生成网络模块对多个第一向量、预设噪声信息和文本信息进行处理,得到待生成视频。由此,使生成待生成视频不仅符合文本信息描述且包括多个目标视频,提高了生成的待生成视频与用户需要的视频之间的匹配度,提升了用户体验。
技术关键词
网络模块
视频生成模型
噪声信息
适配器
标签文本
样本
模板
存储计算机程序
参数
可读存储介质
存储器
处理器
分辨率
电子设备
系统为您推荐了相关专利信息
图像查重方法
大语言模型
图像数据集合
局部敏感哈希方法
跨模态
特征提取电路
传感器阵列
智能降噪
深度神经网络模块
时序