语音生成方法、装置、电子设备及计算机可读存储介质

正文

推荐专利

申请号：CN202410814374

申请日期：2024-06-21

公开号：CN118982977A

公开日期：2024-11-19

类型：发明专利

摘要

本申请公开了一种语音生成方法、装置、电子设备及计算机可读存储介质，涉及互联网技术领域，在构建语音生成模型的过程中额外引入了描述语音特点的音素持续时长和样本语音特征信息同时进行监督训练，使得语音生成模型能够生成较为自然的带有情感表达的特定说话人的高质量语音。所述方法包括：确定待转化为语音的目标声音特征信息、目标情感信息以及目标文本；利用语音生成模型对目标文本、目标声音特征信息和目标情感信息进行训练，得到目标语音；其中语音生成模型是基于样本文本对应的音素持续时长以及样本语音对应的样本语音特征信息对训练模型训练得到；样本语音特征信息包括以下至少一项：样本声音特征信息和样本情感信息；输出目标语音。

技术关键词

语音生成模型样本语音特征信息文本语音生成方法对齐工具序列特征生成指令可读存储介质电子设备索引音频互联网技术时间段生成装置计算机处理器输出模块

系统为您推荐了相关专利信息

视频脚本生成方法、装置、电子设备及存储介质

视频文本脚本生成方法标签子模块

一种直播素材的推荐方法、系统、电子设备及存储介质

关键词数据存储结构推荐方法主题文本

用于代码分析的对话式GPT数据处理方法及系统

数据处理方法参数文本段落关键词可执行程序代码

代客行为检测方法、装置、设备、存储介质及程序产品

计算机执行指令终端设备视频帧人脸检测模型状态空间模型

一种导航欺骗干扰检测方法、装置及电子设备

相关器欺骗干扰检测方法支路欺骗干扰信号伪随机码

语音生成方法、装置、电子设备及计算机可读存储介质

站点导航

APP 下载