摘要
本发明提供了人工智能技术领域的一种基于情感分析的情感语音合成方法,包括:步骤S1、预训练文本情感分析模型;步骤S2、获取大量的语音数据提取语音特征,基于语音特征以及情感类别进行标注并存储至情感语音库;步骤S3、通过文本情感分析模型对各历史情感文本进行分类得到情感类别,基于情感类别从情感语音库匹配语音数据,基于匹配的各历史情感文本和语音数据构建数据集;步骤S4、创建情感语音合成模型、情感控制模型,通过数据集对情感语音合成模型、情感控制模型进行训练;步骤S5、基于情感语音合成模型以及情感控制模型创建多情感语音合成系统以进行语音合成。本发明的优点在于:极大的提升了情感语音合成的真实感以及用户体验。
技术关键词
情感类别
情感分析模型
前馈神经网络
语音特征
文本
声学特征
递归神经网络
数据
短时傅里叶变换
离散余弦变换
人工智能技术
编码器
注意力机制
波形
音频
真实感