基于互信息的强度可控的情感语音合成方法

正文

推荐专利

基于互信息的强度可控的情感语音合成方法

申请号：CN202410855072

申请日期：2024-06-28

公开号：CN118711563A

公开日期：2024-09-27

类型：发明专利

摘要

本发明公开了基于互信息的强度可控的情感语音合成方法，首先目标语音标注；然后情感强度计算、建模情感表示、强度属性、文本表示，然后将得到的情感嵌入、强度嵌入和文本嵌入送入时长预测器，生成预测的音素时长；最后语谱图解码：利用语谱图解码器将音素时长转换为预测频谱图；情感语音合成。本发明旨在合成与目标情感一致的情感语音，并实现对情感强度的灵活控制，使合成语音能够生动地表达所需的情感。

技术关键词

语谱图文本编码器强度语音特征情感分类器解码器时域特征注意力频域特征门控循环单元深度神经网络时间段样本标记多层感知机

系统为您推荐了相关专利信息

一种基于AI问答的数据处理方法及其系统

数据处理方法环境光线强度知识点答案人工智能交互技术

一种正向深孔大爆破放顶实现残矿回收的方法

三维激光扫描仪孔道裂缝三维模型注浆

一种语音识别方法、装置、设备及存储介质

语音特征语音识别模型语音识别方法特征提取模块处理单元

一种基于人工智能的语音处理方法和装置

降噪模型降噪需求语音特征说话人识别技术数据

基于向量化与序列到序列代理模型的地震需求预测方法

需求预测方法钢筋混凝土框架结构序列地震拉丁超立方采样

基于互信息的强度可控的情感语音合成方法

站点导航

APP 下载