摘要
本申请涉及一种歌声合成模型处理方法、歌声合成方法、设备和存储介质。歌声合成模型的处理方法包括:将样本特征输入待训练的歌声合成模型中歌声特征预测器,得到预测歌声特征,并通过预测歌声特征训练歌声特征预测器;将样本歌声信号对应的样本频谱信息输入歌声合成模型中的频谱生成模块,得到预测频谱信息,通过预测频谱信息训练频谱生成模块;将样本歌词文本对应的语义信息输入歌声合成模型的扩散模块,得到样本歌声信号对应的先验特征,并利用先验特征训练扩散模块;根据训练完成的歌声特征预测器、频谱生成模块以及扩散模块,得到训练完成的歌声合成模型。采用本方法不需要依赖于曲谱信息的标注,能降低模型标注的成本。
技术关键词
样本
文本
编码特征
模块
噪声特征
解码器
信号
编码器
语义
特征提取模型
计算机程序产品
处理器
声码器
计算机设备
可读存储介质
存储器
序列
系统为您推荐了相关专利信息
光伏电站故障诊断
多模态数据采集
终端模块
多源异构数据融合
电气特征
PCR用引物
定量PCR试剂盒
生物标志物
色谱分析系统
质谱分析
评价数据处理方法
深度学习网络模型
订单
物流
注意力机制
智能管理系统
充电桩控制器
监测电池充电状态
云端服务器
设备状态数据
反搏装置
动脉血压波形
短时傅里叶变换
粒子群优化算法
控制执行模块