语音合成方法、装置、电子设备和存储介质

正文

推荐专利

语音合成方法、装置、电子设备和存储介质

申请号：CN202411906533

申请日期：2024-12-23

公开号：CN119763545B

公开日期：2025-09-23

类型：发明专利

摘要

本发明提供一种语音合成方法、装置、电子设备和存储介质，涉及语音技术领域，其中方法包括：将获取的待合成文本和情感属性输入语音合成模型中，得到语音合成模型输出的目标语音；其中，语音合成模型为基于第一样本语音对应的第一样本文本和第一样本语音对应的第一样本情感特征训练得到的，第一样本情感特征为将第一样本语音输入情感编码模型后得到的，情感编码模型为基于目标编码和第二样本情感特征的最小互信息损失训练得到的。本发明能够基于最小互信息损失训练得到情感编码模型，以使情感编码模型输出的情感特征中不包括音色和文本内容等不相关信息，使得语音合成模型能够实现对细粒度情感的控制，提高了语音合成的控制力。

技术关键词

情感特征样本语音解码网络语音特征提取文本语音编码语义特征参数非暂态计算机可读存储介质电子设备语音技术处理器风格存储器模板对象

系统为您推荐了相关专利信息

图像生成方法、装置、计算机设备和存储介质

降噪特征噪声特征对象交叉注意力机制文本生成图像

基于客户业务数据分析的智能交互系统

智能交互系统查询意图语音识别模型声纹认证客户

一种基于光谱预处理的无籽与有籽西瓜可溶性固形物的检测方法

西瓜可溶性固形物含量特征提取模块线性曲线

大语言模型进行会话分析任务的批测方法、设备及介质

大语言模型标签神经网络模型测试场景模板

印章识别方法、装置、计算机设备及存储介质

文本行印章识别方法印章识别装置坐标计算机设备

语音合成方法、装置、电子设备和存储介质

站点导航

APP 下载