摘要
本申请涉及一种文本转语音方法、装置、计算机设备、可读存储介质和程序产品。本方法包括:根据目标文本,得到语义声牌;将语义声牌转换为语音声牌;将语义声牌、语音声牌和参考音频输入预先构建的解码器,得到解码结果;根据解码结果,得到与目标文本对应的目标音频。采用本方法能够降低不同语种建模的难度,提高文本转语音的准确率。
技术关键词
语义
置信度阈值
文本转语音方法
音频
解码器
计算机设备
可读存储介质
语音装置
计算机程序产品
处理器
注意力机制
模块
存储器
系统为您推荐了相关专利信息
意图估计方法
轨迹预测模型
人机协作
机器人
合作博弈论
虚拟图像生成方法
纹理
像素点
中央控制台
生成对抗网络