一种基于旋律引导的文字生成音乐算法

正文

推荐专利

一种基于旋律引导的文字生成音乐算法

申请号：CN202510117783

申请日期：2025-01-24

公开号：CN119943011A

公开日期：2025-05-06

类型：发明专利

摘要

本发明适用于音乐生成技术领域，提供了一种基于旋律引导的文字生成音乐算法，其方法包括：通过公共数据集获取音乐波形、旋律和文本描述这三种模态的数据后编码；将编码后得到的音频表征、旋律表征和文本表征对齐在统一向量空间中；以文本表征作为查询条件在构建的旋律向量数据库中检索目标旋律向量表征；将目标旋律向量表征和文本表征作为融合条件引导扩散过程，生成符合文本描述和旋律引导的潜在音乐表征；利用变分自动解码器中的解码器将所述潜在音乐表征进行初步解码为目标梅尔频谱图；通过声码器将所述目标梅尔频谱图转换为可播放的音乐，最终生成了符合文本描述且旋律优美的高质量可播放音乐。

技术关键词

文本音频多层感知器批量数据解码器音乐生成技术变分自动编码器样本表达式声码器神经网络结构梯度下降算法噪声预测波形参数

系统为您推荐了相关专利信息

商品图像生成方法、系统、计算机设备和存储介质

文本元素数据布局模板图像生成方法

神经网络模型的压缩方法、设备、存储介质及程序产品

注意力神经网络模型键值矩阵参数

一种基于LSTM的WPE逆滤波去混响方法

去混响方法混响信号时序特征卷积特征滤波器系数

一种图形用户界面GUI数据生成方法及装置、电子设备和存储介质

元素文本图形用户界面数据生成方法图像分析

基于多模态图像配准的手术机器人切除导航方法

深度学习网络三维模型手术机器人导航方法多模态图像信息

一种基于旋律引导的文字生成音乐算法

站点导航

APP 下载