一种基于互信息理论的自监督语音特征增强语音合成方法

AITNT
正文
推荐专利
一种基于互信息理论的自监督语音特征增强语音合成方法
申请号:CN202510430211
申请日期:2025-04-08
公开号:CN119964551B
公开日期:2025-06-24
类型:发明专利
摘要
一种基于互信息理论的自监督语音特征增强语音合成方法,涉及语音合成技术领域。该方法通过引入自监督语音特征,作为文本的声学补充,设计基于互信息最大化和最小化的信息瓶颈模块,从自监督语音特征中提取紧凑且与任务相关的自监督表示,并通过最大化文本表示与自监督表示之间的互信息,增强文本表示的声学信息,从而提高语音合成的自然度和质量。在单说话人和多说话人语音合成场景下均表现出色,且具有良好的跨语言适应性,能够有效提升不同语言环境下的语音合成质量。
技术关键词
文本编码器 理论 上采样 网络 双线性插值算法 解码器 声学特征 语音特征提取 超参数 变量 处理器 瓶颈 声码器 框架 序列
系统为您推荐了相关专利信息
1
一种控制残余臭氧浓度的分析系统和方法
臭氧 分析子系统 油烟 分析系统 催化剂
2
数字孪生辅助的协同感知与边缘协作的资源分配方法
数字孪生 资源分配方法 全局地图 边缘协作方法 深度确定性策略梯度
3
基于无线通信的摄像头监控系统及通信协议优化方法
摄像头监控系统 云端数据中心 量子加密通信技术 Retinex算法 生成对抗网络
4
与车载设备进行无线通信的方法、装置及电子设备
通信设备 车载设备 密钥 加密数据 非对称加密算法
5
一种用于肝癌诊断的多模态成像数据处理方法
成像数据处理方法 肝脏 融合网络架构 三维可视化模型 患者
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号