摘要
本申请公开了一种有声内容生成方法及相关装置、设备和存储介质,其中,有声内容生成方法包括:获取待合成的文本内容;合成文本内容的内容音频,并预测文本内容中需要音效的文本片段和所需音效的第一描述文本;生成符合第一描述文本的音效音频;在内容音频中与文本片段相对应的音频位置处合轨音效音频,得到有声内容。上述方案,能够实现有声内容的自动生成,并满足音效的多样性以及多事件复杂音效的需求。
技术关键词
文本
音效
音频
内容生成方法
深度神经网络
样本
大语言模型
生成视频内容
内容生成装置
指令
字符
程序
处理器
可读存储介质
图片
模块
存储器
序列
电子设备
计算机
系统为您推荐了相关专利信息
语义知识图谱
试卷
教学资源数据
分布特征
访问时长
劳保用品
深度Q网络
深度强化学习算法
天然气站场
生成作业