摘要
本发明涉及用于多条件音频生成的系统和方法。用于音频生成的方法包括使用编码器针对所获得的输入定义音频输入条件,其中所获得的输入指示一个或多个音频特性。该方法还包括采用音频特征提取神经网络来定义所选音频风格简档的音频风格条件,以及使用多条件潜在扩散模型来输出指示期望生成音频的生成音频数据,所述多条件潜在扩散模型采用所述音频输入条件和所述音频风格条件作为对所述多条件潜在扩散模型的适配器。
技术关键词
生成音频数据
音频特征提取
风格
文本
浅层卷积神经网络
定义
编码器
适配器
样本
解码器
计算机
简档
令牌
介质
指令
生成系统
系统为您推荐了相关专利信息
金融风险评估方法
大数据
风险控制策略
多模态数据融合
非结构化文本
文本信息抽取方法
状态空间模型
计算机可读指令
解码网络
序列
情感特征
编码特征
特征提取模型
文本
情感分类器