语音合成方法、装置、电子设备及存储介质

正文

推荐专利

语音合成方法、装置、电子设备及存储介质

申请号：CN202511439834

申请日期：2025-10-10

公开号：CN120895024B

公开日期：2025-12-09

类型：发明专利

摘要

本发明提供一种语音合成方法、装置、电子设备及存储介质，涉及语音合成技术领域，该方法在语音合成过程中引入目标属性文本，可以支持具有目标属性文本对应的音频属性的语音合成，进而可以根据用户需求控制目标合成语音的表现力和韵律，使目标合成语音更加符合用户需求，提高用户体验。通过带有属性标签的文本样本训练得到语音合成模型，可以使语音合成模型在语音合成时具有音频属性的控制能力，可以同时控制目标合成语音的音色、语音风格、情感表达、人设、语气、韵律等音频属性，并可以支持语种切换、环境音效、方言生成等音频属性，保证语音合成模型生成质量的同时提升可控性。

技术关键词

声学特征文本语音解码模块编码模块语义特征编码器样本解码器标签序列音频电子设备处理器风格可读存储介质存储器音效发音数据