用于多条件音频生成的系统和方法

AITNT
正文
推荐专利
用于多条件音频生成的系统和方法
申请号:CN202510633454
申请日期:2025-05-16
公开号:CN120977283A
公开日期:2025-11-18
类型:发明专利
摘要
本发明涉及用于多条件音频生成的系统和方法。用于音频生成的方法包括使用编码器针对所获得的输入定义音频输入条件,其中所获得的输入指示一个或多个音频特性。该方法还包括采用音频特征提取神经网络来定义所选音频风格简档的音频风格条件,以及使用多条件潜在扩散模型来输出指示期望生成音频的生成音频数据,所述多条件潜在扩散模型采用所述音频输入条件和所述音频风格条件作为对所述多条件潜在扩散模型的适配器。
技术关键词
生成音频数据 音频特征提取 风格 文本 浅层卷积神经网络 定义 编码器 适配器 样本 解码器 计算机 简档 令牌 介质 指令 生成系统
系统为您推荐了相关专利信息
1
基于大数据的金融风险评估方法
金融风险评估方法 大数据 风险控制策略 多模态数据融合 非结构化文本
2
一种大模型集群部署方法、装置、设备及存储介质
集群部署方法 字符生成速度 异构 列表 协作模型
3
一种基于混合模型的文本信息抽取方法及系统
文本信息抽取方法 状态空间模型 计算机可读指令 解码网络 序列
4
一种数字人定制方法、云端、车机端、设备、介质及产品
生成数字人 图片 车机 模板 定制方法
5
一种语音合成方法、装置、设备和存储介质
情感特征 编码特征 特征提取模型 文本 情感分类器
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号