一种基于柯西去噪概率扩散模型的语音合成方法及装置

AITNT
正文
推荐专利
一种基于柯西去噪概率扩散模型的语音合成方法及装置
申请号:CN202411013175
申请日期:2024-07-26
公开号:CN119049446B
公开日期:2025-10-03
类型:发明专利
摘要
本发明公开了一种基于柯西去噪概率扩散模型的语音合成方法及装置,包括:(1)计算面向语音合成的柯西噪声表;(2)计算面向语音合成的柯西后验平方尺度表;(3)实现面向语音合成的柯西扩散过程;(4)构建去噪神经网络,计算面向语音合成的柯西去噪神经网络损失函数;(5)实现面向语音合成的柯西去噪扩散模型的采样过程。本发明将柯西噪声引入去噪概率扩散模型,实现扩散模型的训练和采样,最终完成语音合成。利用本发明,可以提高语音合成方法的鲁棒性,有效提升了合成语音的质量。
技术关键词
语音 噪声预测 定义 采样模块 深度神经网络 比率 存储器 鲁棒性 处理器 信号 时序 框架
系统为您推荐了相关专利信息
1
基于音频的特效生成方法、装置、设备以及存储介质
特效生成方法 控制策略 音频特征 文本 特效生成装置
2
显示面板和显示装置
辅助电极 阵列基板 衬底 面板 天线
3
一种APPSDK隐私政策的维护方法
信息展示页面 HTTP请求 LSTM模型 代码库 文本
4
低轨卫星的多普勒差分定位方法、装置、设备和介质
大气误差 三维运动状态 无迹卡尔曼滤波算法 差分定位方法 多普勒
5
一种多模态驾驶员情绪识别方法、装置、设备及介质
情绪识别模型 多模态信息 坐标点 频谱特征 驾驶员情绪识别
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号