摘要
本申请公开了一种中性音色的语音合成方法及相关装置,涉及音频处理技术领域,确定中性音色提示音频和中性音色模型,将待合成的目标文本和中性音色提示音频输入到中性音色模型中,由中性音色模型输出目标文本对应的中性音色音频。基于本发明,通过输入文本即可合成具有中性音色的音频,中性音色位于男性音色与女性音色之间,以此消除语音合成时的性别特征,具有广泛适用性。
技术关键词
音频
特征提取网络
文本编码器
序列
说话人识别模型
性别分类模型
语音
计算机可读指令
电子设备
索引
解码器
计算机存储介质
存储计算机程序
计算机程序产品
中间层
注意力
处理器
模块
系统为您推荐了相关专利信息
文本特征向量
医院门诊管理系统
语义理解模型
神经网络模型
人工智能语音