摘要
本申请涉及计算机技术领域,公开了一种基于韵律预测的语音合成方法、装置和可读存储介质。该方法包括:将根据文本信息进行编码后得到的与文本信息对应的字符级特征和文本信息对应的音素级特征相加,并对相加后的特征进行编码,得到文本特征;基于韵律预测模型和局部韵律变化参数对文本特征进行处理,得到文本特征对应的随机韵律特征;其中,随机韵律特征包括随机基频特征、随机能量特征和随机时长特征;根据随机韵律特征和文本特征,生成文本信息对应的语音信息。本申请基于随机基频特征、随机能量特征和随机时长特征生成语音信息,从而能够提高所生成的语音信息的情感丰富度和自然度。
技术关键词
韵律特征
文本
韵律预测模型
样本
上采样
计算机程序产品
语音特征
参数
转换器
可读存储介质
生成语音
字符
编码模块
指令
系统为您推荐了相关专利信息
风险预测方法
鸟击事件
评估指标体系
XGBoost模型
算法模型
三文鱼货架期
剩余货架期
机器学习算法
支持向量机
校正
智能电能表
连续特征
风险评估方法
特征数据库
离散特征
事件评估方法
泵站
排水口
闸门
欧式距离计算方法