摘要
本发明提供一种语音合成方法、装置、电子设备及存储介质,涉及语音合成技术领域,该方法在语音合成过程中引入目标属性文本,可以支持具有目标属性文本对应的音频属性的语音合成,进而可以根据用户需求控制目标合成语音的表现力和韵律,使目标合成语音更加符合用户需求,提高用户体验。通过带有属性标签的文本样本训练得到语音合成模型,可以使语音合成模型在语音合成时具有音频属性的控制能力,可以同时控制目标合成语音的音色、语音风格、情感表达、人设、语气、韵律等音频属性,并可以支持语种切换、环境音效、方言生成等音频属性,保证语音合成模型生成质量的同时提升可控性。
技术关键词
声学特征
文本
语音
解码模块
编码模块
语义特征
编码器
样本
解码器
标签
序列
音频
电子设备
处理器
风格
可读存储介质
存储器
音效
发音
数据
系统为您推荐了相关专利信息
生长状态图像
养殖管理方法
南美白对虾
实景三维模型
数据
专家数据库
抽取系统
深度学习模型
信息检索技术
归一化方法
决策算法
语义分析模型
文本生成方法
框架
文本生成装置