歌声合成模型的处理方法、歌声合成方法、设备和介质

AITNT
正文
推荐专利
歌声合成模型的处理方法、歌声合成方法、设备和介质
申请号:CN202410979905
申请日期:2024-07-22
公开号:CN118737120A
公开日期:2024-10-01
类型:发明专利
摘要
本申请涉及一种歌声合成模型处理方法、歌声合成方法、设备和存储介质。歌声合成模型的处理方法包括:将样本特征输入待训练的歌声合成模型中歌声特征预测器,得到预测歌声特征,并通过预测歌声特征训练歌声特征预测器;将样本歌声信号对应的样本频谱信息输入歌声合成模型中的频谱生成模块,得到预测频谱信息,通过预测频谱信息训练频谱生成模块;将样本歌词文本对应的语义信息输入歌声合成模型的扩散模块,得到样本歌声信号对应的先验特征,并利用先验特征训练扩散模块;根据训练完成的歌声特征预测器、频谱生成模块以及扩散模块,得到训练完成的歌声合成模型。采用本方法不需要依赖于曲谱信息的标注,能降低模型标注的成本。
技术关键词
样本 文本 编码特征 模块 噪声特征 解码器 信号 编码器 语义 特征提取模型 计算机程序产品 处理器 声码器 计算机设备 可读存储介质 存储器 序列
系统为您推荐了相关专利信息
1
光伏电站故障诊断系统
光伏电站故障诊断 多模态数据采集 终端模块 多源异构数据融合 电气特征
2
用于诊断早期宫颈癌淋巴结转移的标志物、试剂盒及其应用
PCR用引物 定量PCR试剂盒 生物标志物 色谱分析系统 质谱分析
3
物流订单评价数据处理方法、装置、设备及存储介质
评价数据处理方法 深度学习网络模型 订单 物流 注意力机制
4
一种汽车充电桩的智能管理系统
智能管理系统 充电桩控制器 监测电池充电状态 云端服务器 设备状态数据
5
一种体外反搏自适应参数调整方法
反搏装置 动脉血压波形 短时傅里叶变换 粒子群优化算法 控制执行模块
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号