摘要
本发明涉及音频技术领域,具体提供一种基于自然语言提示的音乐生成方法,包括以下步骤:S1.从前端/移动端文本框获得用户输入自然语言提示词,发送到后端进行处理;S2.通过基于Transformer编码器将其嵌入为高维向量;S3.初始化音乐为<songstart>标记,作为音乐生成的起始点;S4.循环处理音乐生成;S5.将音乐以abc谱或midi形式返回到前端。通过树形网络编码器和多头注意力机制,提高了音乐生成的速度和质量,采用节奏旋转位置编码(BRoPE)和多层绝对位置编码。使模型能够更好地处理音乐节奏和结构。
技术关键词
音乐生成方法
自然语言
应用服务器
多头注意力机制
AI服务器
树形网络
数据服务器
结构单元
编码器
计算方法
移动端
编码向量
标记
生成系统
数据安全
音头
互联网
周期
系统为您推荐了相关专利信息
语音交互方法
语种识别
文本
语音特征
非暂态计算机可读存储介质
降雨预测方法
多头注意力机制
时序
动态邻接矩阵
气象
负荷识别方法
频域特征
感应式电流互感器
时域特征
家用电器
模板
搜索方法
排序模型
关键词
机器学习模型训练