摘要
本发明公开了一种基于柯西去噪概率扩散模型的语音合成方法及装置,包括:(1)计算面向语音合成的柯西噪声表;(2)计算面向语音合成的柯西后验平方尺度表;(3)实现面向语音合成的柯西扩散过程;(4)构建去噪神经网络,计算面向语音合成的柯西去噪神经网络损失函数;(5)实现面向语音合成的柯西去噪扩散模型的采样过程。本发明将柯西噪声引入去噪概率扩散模型,实现扩散模型的训练和采样,最终完成语音合成。利用本发明,可以提高语音合成方法的鲁棒性,有效提升了合成语音的质量。
技术关键词
语音
噪声预测
定义
采样模块
深度神经网络
比率
存储器
鲁棒性
处理器
信号
时序
框架
系统为您推荐了相关专利信息
特效生成方法
控制策略
音频特征
文本
特效生成装置
信息展示页面
HTTP请求
LSTM模型
代码库
文本
大气误差
三维运动状态
无迹卡尔曼滤波算法
差分定位方法
多普勒
情绪识别模型
多模态信息
坐标点
频谱特征
驾驶员情绪识别