摘要
本发明涉及人工智能技术领域,公开了一种双语语音的合成方法、装置、计算机设备及存储介质。通过将具有第一语音和第二语言的文本内容对应的待处理文本进行编码处理,获取到双语文本特征;根据第一语言和第二语言,获取该双语的第一语言特征和第一音韵特征;采用特征强度调制器,分别对双语文本特征、第一语言特征和第一音韵特征进行处理,得到对应的目标语言特征和目标音韵特征,用于捕捉语言和语音的动态强度,调节音韵控制;最后根据双语文本特征、目标语言特征和目标音韵特征进行解码处理,得到合成后的目标双语语音。通过捕捉双语之间的表达特征,特征强度调制器调节音韵特征,提高在不同场景下所合成语音音调的准确性。
技术关键词
文本
强度调制器
计算机设备
解码
语音特征
可读存储介质
编码
人工智能技术
处理器
注意力机制
网络
模块
存储器
线性
场景
动态