摘要
本公开提供了一种生成视频的方法、装置、电子设备及存储介质,涉及人工智能技术领域,尤其涉及大语言模型、生成模型、图像处理等领域。具体实现方案为:获取主题、目标风格和N个输入图像,N是大于等于1的整数;将N个输入图像转换为符合目标风格的N个图像;根据主题和N个输入图像,确定故事文本;其中,故事文本包括具有顺序的N个子文本,且N个子文本与N个图像相对应;以及基于目标视频模板处理N个图像和N个子文本,得到视频;其中,N个图像在视频中的顺序与N个子文本的顺序一致。
技术关键词
文本
模板
风格
大语言模型
视频
主题
子模块
电子设备
人工智能技术
计算机程序产品
字幕
处理器通信
指令
图像处理
可读存储介质
存储器
系统为您推荐了相关专利信息
功能蛋白
蛋白质功能域
筛选方法
大语言模型
矩阵
缺陷智能检测方法
电子产品中框
特征轮廓
图片
图像
特征提取网络
跟踪方法
文本
检测损失
多模态特征融合