一种基于互信息理论的自监督语音特征增强语音合成方法

正文

推荐专利

申请号：CN202510430211

申请日期：2025-04-08

公开号：CN119964551B

公开日期：2025-06-24

类型：发明专利

摘要

一种基于互信息理论的自监督语音特征增强语音合成方法，涉及语音合成技术领域。该方法通过引入自监督语音特征，作为文本的声学补充，设计基于互信息最大化和最小化的信息瓶颈模块，从自监督语音特征中提取紧凑且与任务相关的自监督表示，并通过最大化文本表示与自监督表示之间的互信息，增强文本表示的声学信息，从而提高语音合成的自然度和质量。在单说话人和多说话人语音合成场景下均表现出色，且具有良好的跨语言适应性，能够有效提升不同语言环境下的语音合成质量。

技术关键词

文本编码器理论上采样网络双线性插值算法解码器声学特征语音特征提取超参数变量处理器瓶颈声码器框架序列

系统为您推荐了相关专利信息

一种控制残余臭氧浓度的分析系统和方法

臭氧分析子系统油烟分析系统催化剂

数字孪生辅助的协同感知与边缘协作的资源分配方法

数字孪生资源分配方法全局地图边缘协作方法深度确定性策略梯度

基于无线通信的摄像头监控系统及通信协议优化方法

摄像头监控系统云端数据中心量子加密通信技术 Retinex算法生成对抗网络

与车载设备进行无线通信的方法、装置及电子设备

通信设备车载设备密钥加密数据非对称加密算法

一种用于肝癌诊断的多模态成像数据处理方法

成像数据处理方法肝脏融合网络架构三维可视化模型患者

一种基于互信息理论的自监督语音特征增强语音合成方法

站点导航

APP 下载