摘要
本发明公开了一种基于谱熵选片的生成对抗网络音乐流派风格转换方法,包括:提取音乐样本的谱熵特征,根据预设非重点片段谱熵比例以及排序后的各帧谱熵选择第一类重点特征片段时间范围;对样本进行均匀分片,根据片内局部谱熵最小均值计算阈值选择第二类重点特征片段时间范围。在训练过程中,按照两种类型的重点片段特征时间范围,使用L×M的感受野表示每一个梅尔频谱图中的重点音乐风格特征片段,并在网络训练过程中对不同的重点片段赋予不同的权重,利用生成对抗网络进行处理。本发明根据谱平坦度信息对音乐样本的梅尔频谱图特征按权重进行区分训练,使生成对抗网络训练过程能更准确捕获音乐流派风格信息,有效提升音乐风格转换的性能。
技术关键词
转换方法
音乐模型训练
生成对抗网络训练
音频
声码器
风格
样本
频率
短时傅里叶变换
采样率
分片
模块
序列
功率
参数
核心
元素
系统为您推荐了相关专利信息
车载智能音箱
音效优化方法
音频特征
车载音箱
音频增益控制
多维感知数据
决策支持平台
智能巡检
无人机平台
移动式
信息生成方法
字幕
信息生成程序
视频
语音识别模型
供电服务管理
资源动态配置
文本语义分析
音频
工单预警