摘要
本发明涉及视频生成技术领域,可应用于金融科技和医疗健康领域,公开了一种幻灯片视频自动生成方法、装置、设备及介质,包括:获取幻灯片文件,其中,幻灯片文件包括多张幻灯片及每张幻灯片所对应的讲解信息;根据讲解信息及输入的目标视频描述信息对幻灯片中的文本内容进行处理以得到关键文本信息,并将关键文本信息转换为旁白语音;通过计算机视觉技术提取幻灯片中的非文本内容,并对非文本内容进行处理得到关键非文本信息,将幻灯片中的关键非文本信息进行高亮显示得到高亮显示幻灯片;根据旁边语音所对应的旁白内容和高亮显示幻灯片通过预置的伪自回归模型生成目标视频。有效地提升了生成的视频质量和生成效率。
技术关键词
视频自动生成方法
显示幻灯片
文本
计算机视觉技术
信息提取模型
语音
TTS技术
分类边界
大语言模型
视频生成技术
图表
可读存储介质
医疗健康
处理器
坐标
图像
标记
视觉特征
生成装置