摘要
本申请提供了一种音乐生成方法、装置、电子设备及可读存储介质。所述方法包括:将文本描述和第一音频数据输入至已训练的音乐生成模型,获得已训练的音乐生成模型输出的第二音频数据,文本描述为音乐风格描述;在第二音频数据中的前预设时间段的音频数据设置为初始时间段的音频数据,获得第一音频数据后,返回执行步骤:将文本描述和第一音频数据输入至已训练的音乐生成模型,获得已训练的音乐生成模型输出的第二音频数据,直至生成时长达到预设时长。本申请实现已训练的音乐生成模型结合初始时间段的音频数据和模型上一次输出的音频数据,预测第二音频数据,能够保证生成的音频数据的质量,进而能够获得所需时长的高质量音乐。
技术关键词
文本编码器
音频编码器
音乐生成方法
数据
音频解码器
多头注意力机制
样本
时间段
电子设备
可读存储介质
处理器
压缩算法
生成装置
存储器
计算机
系统为您推荐了相关专利信息
磁共振图像数据
深度学习特征
组学特征
集成学习策略
脑胶质瘤
三维点云数据
红外激光发射器
计算机视觉算法
三角形网格模型
巡检机器人
热点挖掘系统
热点挖掘方法
信息采集模块
互联网
文本聚类算法
环境监测模块
数据处理模块
数据通信单元
强化学习算法
任务调度