语音合成方法、装置、电子设备及存储介质

正文

推荐专利

语音合成方法、装置、电子设备及存储介质

申请号：CN202511556138

申请日期：2025-10-29

公开号：CN121034283A

公开日期：2025-11-28

类型：发明专利

摘要

本发明提供一种语音合成方法、装置、电子设备及存储介质，属于人工智能技术领域，包括：获取待合成文本以及语气描述文本用于描述待合成的目标语音信号的非语义信息，对待合成文本和语气描述文本进行联合编码得到混合词元序列，将混合词元序列输入至语气控制合成模型获取语气控制合成模型输出的音频词元序列，对音频词元序列进行解码获取目标语音信号。本发明提供的语音合成方法、装置、电子设备及存储介质，通过将自然语言形式的语气描述文本作为附加输入参数，使模型能够直接理解并对语音的非语义属性进行精准调控，解决了现有技术依赖固定标签、控制粒度粗、表达能力单一的技术问题，显著提升了合成语音的可控性、多样性与拟人化表现力。

技术关键词

文本双模态样本序列语音标签音频语义向量数据非暂态计算机可读存储介质大语言模型信号电子设备自然语言信息采集模块编码参数人工智能技术处理器

语音合成方法、装置、电子设备及存储介质

站点导航

APP 下载