摘要
本发明实施例提供了一种视频生成方法、装置、电子设备及存储介质,涉及计算机应用技术领域,包括:获取剧情文本;对剧情文本进行切分,得到分段剧情文本;针对每一分段剧情文本,确定原始视频中与分段剧情文本对应的视频片段、以及将分段剧情文本作为解说文本,利用文本转语音TTS方式,将解说文本转换成语音,得到分段剧情文本对应的解说语音;提取视频片段中的视频画面作为分段剧情文本对应的解说视频画面,并将分段剧情文本对应的解说语音作为解说视频画面对应的解说语音;按照对剧情文本进行切分的切分时序,将每一分段剧情文本分别对应的解说视频画面和解说语音进行合成,得到目标视频。实现自动化、高效地生成视频。
技术关键词
文本
语音
分段
画面
视频生成方法
语句
时序
可读存储介质
音频
视频生成装置
通信接口
计算机
电子设备
存储器
处理器
样本
字幕
摘要
语义
系统为您推荐了相关专利信息
软件开发数据
软件开发效率
深度强化学习
项目管理工具
需求预测模型
情绪识别方法
文本
多层注意力
卡尔曼滤波器
视觉
意图识别
自然语言理解
信息检索
意图类别
大语言模型