用于多条件音频生成的系统和方法

正文

推荐专利

用于多条件音频生成的系统和方法

申请号：CN202510633454

申请日期：2025-05-16

公开号：CN120977283A

公开日期：2025-11-18

类型：发明专利

摘要

本发明涉及用于多条件音频生成的系统和方法。用于音频生成的方法包括使用编码器针对所获得的输入定义音频输入条件，其中所获得的输入指示一个或多个音频特性。该方法还包括采用音频特征提取神经网络来定义所选音频风格简档的音频风格条件，以及使用多条件潜在扩散模型来输出指示期望生成音频的生成音频数据，所述多条件潜在扩散模型采用所述音频输入条件和所述音频风格条件作为对所述多条件潜在扩散模型的适配器。

技术关键词

生成音频数据音频特征提取风格文本浅层卷积神经网络定义编码器适配器样本解码器计算机简档令牌介质指令生成系统

系统为您推荐了相关专利信息

基于大数据的金融风险评估方法

金融风险评估方法大数据风险控制策略多模态数据融合非结构化文本

一种大模型集群部署方法、装置、设备及存储介质

集群部署方法字符生成速度异构列表协作模型

一种基于混合模型的文本信息抽取方法及系统

文本信息抽取方法状态空间模型计算机可读指令解码网络序列

一种数字人定制方法、云端、车机端、设备、介质及产品

生成数字人图片车机模板定制方法

一种语音合成方法、装置、设备和存储介质

情感特征编码特征特征提取模型文本情感分类器

用于多条件音频生成的系统和方法

站点导航

APP 下载