一种基于柯西去噪概率扩散模型的语音合成方法及装置

正文

推荐专利

申请号：CN202411013175

申请日期：2024-07-26

公开号：CN119049446B

公开日期：2025-10-03

类型：发明专利

摘要

本发明公开了一种基于柯西去噪概率扩散模型的语音合成方法及装置，包括：(1)计算面向语音合成的柯西噪声表；(2)计算面向语音合成的柯西后验平方尺度表；(3)实现面向语音合成的柯西扩散过程；(4)构建去噪神经网络，计算面向语音合成的柯西去噪神经网络损失函数；(5)实现面向语音合成的柯西去噪扩散模型的采样过程。本发明将柯西噪声引入去噪概率扩散模型，实现扩散模型的训练和采样，最终完成语音合成。利用本发明，可以提高语音合成方法的鲁棒性，有效提升了合成语音的质量。

技术关键词

语音噪声预测定义采样模块深度神经网络比率存储器鲁棒性处理器信号时序框架

系统为您推荐了相关专利信息

基于音频的特效生成方法、装置、设备以及存储介质

特效生成方法控制策略音频特征文本特效生成装置

显示面板和显示装置

辅助电极阵列基板衬底面板天线

一种APPSDK隐私政策的维护方法

信息展示页面 HTTP请求 LSTM模型代码库文本

低轨卫星的多普勒差分定位方法、装置、设备和介质

大气误差三维运动状态无迹卡尔曼滤波算法差分定位方法多普勒

一种多模态驾驶员情绪识别方法、装置、设备及介质

情绪识别模型多模态信息坐标点频谱特征驾驶员情绪识别

一种基于柯西去噪概率扩散模型的语音合成方法及装置

站点导航

APP 下载