摘要
本申请实施例公开了一种视频生成方法、装置、电子设备及存储介质,涉及计算机技术领域。视频生成方法包括:获取用户的音频和所述音频的内容文本;将所述内容文本输入大语言模型,使所述大语言模型基于所述内容文本输出所述音频的伴生视频的多个分镜描述文本;基于所述多个分镜描述文本生成多个分镜视频生成提示词,将所述多个分镜视频生成提示词输入视频生成大模型,使所述视频生成大模型基于所述多个分镜视频生成提示词生成所述伴生视频的多个分镜视频;将所述伴生视频的多个分镜视频与所述音频进行合成,生成所述音频对应的音视频作品。
技术关键词
生成提示词
大语言模型
文本
视频生成方法
音视频
风格
视觉
音频特征
视频生成装置
界面
电子设备
平台
处理器
可读存储介质
图片
模块
指令