摘要
本申请实施例提供了一种视频的生成方法、装置、计算机设备、计算机可读存储介质、计算机程序产品,属于多媒体技术领域。该视频的生成方法包括:获取音频数据,所述音频数据包括多条语音内容;对所述音频数据进行声纹识别,确定每条语音内容的说话者标签;一个说话者标签对应一个角色;在所述说话者标签为多个的情况下,为不同的角色分别配置一个可视化对象;及将多个所述角色的可视化对象和各自对应的语音内容进行组合,得到目标视频。本申请实施例的技术方案可以支持将多人对话转为视频,从而适配多人对话的场景且人机交互效率高。
技术关键词
字幕
音频
生成方法
语音
对象
标签
大语言模型
视频
计算机程序产品
可读存储介质
数据
计算机设备
组合模块
容器
处理器通信
生成装置
指令
编辑
系统为您推荐了相关专利信息
纹理生成方法
图案生成器
纹理生成系统
图像
物体
供热机组
负荷预测模型
历史负荷数据
数据分析技术
电子装置