一种基于旋律引导的文字生成音乐算法

AITNT
正文
推荐专利
一种基于旋律引导的文字生成音乐算法
申请号:CN202510117783
申请日期:2025-01-24
公开号:CN119943011A
公开日期:2025-05-06
类型:发明专利
摘要
本发明适用于音乐生成技术领域,提供了一种基于旋律引导的文字生成音乐算法,其方法包括:通过公共数据集获取音乐波形、旋律和文本描述这三种模态的数据后编码;将编码后得到的音频表征、旋律表征和文本表征对齐在统一向量空间中;以文本表征作为查询条件在构建的旋律向量数据库中检索目标旋律向量表征;将目标旋律向量表征和文本表征作为融合条件引导扩散过程,生成符合文本描述和旋律引导的潜在音乐表征;利用变分自动解码器中的解码器将所述潜在音乐表征进行初步解码为目标梅尔频谱图;通过声码器将所述目标梅尔频谱图转换为可播放的音乐,最终生成了符合文本描述且旋律优美的高质量可播放音乐。
技术关键词
文本 音频 多层感知器 批量数据 解码器 音乐生成技术 变分自动编码器 样本 表达式 声码器 神经网络结构 梯度下降算法 噪声预测 波形 参数
系统为您推荐了相关专利信息
1
商品图像生成方法、系统、计算机设备和存储介质
文本 元素 数据 布局模板 图像生成方法
2
神经网络模型的压缩方法、设备、存储介质及程序产品
注意力 神经网络模型 键值 矩阵 参数
3
一种基于LSTM的WPE逆滤波去混响方法
去混响方法 混响信号 时序特征 卷积特征 滤波器系数
4
一种图形用户界面GUI数据生成方法及装置、电子设备和存储介质
元素 文本 图形用户界面 数据生成方法 图像分析
5
基于多模态图像配准的手术机器人切除导航方法
深度学习网络 三维模型 手术机器人 导航方法 多模态图像信息
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号