摘要
本公开提供了一种视频生成方法、装置、电子设备及计算机可读存储介质,可以应用于人工智能和计算机视觉技术领域。该方法包括:根据用户输入的视频内容描述文本,生成场景提示文本,其中,场景提示文本用于限定视频的生成场景;将场景提示文本输入大语言模型,输出至少一个视频分镜文本;根据每个视频分镜文本的关键词,从数据库中确定与每个视频分镜文本匹配的视频片段;以及根据视频分镜文本和至少一个视频片段,生成与视频内容描述文本相匹配的目标视频。
技术关键词
文本
生成场景
视频生成方法
大语言模型
音频
关键词
可读存储介质
视频帧
数据
视频生成装置
计算机视觉技术
电子设备
模板
计算机程序产品
处理器
字幕
信息更新