摘要
本发明公开了一种语音数据的重建方法、装置、计算机设备及存储介质。所述方法包括:通过预设的文本编码器对音素文本执行编码处理后,得到输出向量;通过预设的说话人编码器对说话人提示语言进行编码处理后,得到全局说话人表示;通过预设的韵律模块对所述输出向量和所述全局说话人表示执行预测处理后,得到韵律表示向量;通过预设的解码器对所述韵律表示向量执行解码处理后,得到重建出的语音数据。本方案使用预设的韵律模块处理说话人编码器的全局说话人表示和文本编码器的输出向量,考虑到韵律的全局一致性和局部变化,捕捉当中韵律的分层变化,最终得到提升韵律质量的重建语音,可在自然度和情感表达方面表现更佳。
技术关键词
韵律模块
正弦激励信号
文本编码器
语音
噪声数据
解码器
适配器
计算机设备
分层
神经网络参数
可读存储介质
处理器
存储器
系统为您推荐了相关专利信息
声纹特征
智能语音播放
数据备份方法
验证提示信息
智能语音识别
制动系统
语音采集模块
口令
执行紧急制动
语音识别模块
数据分类算法
事件相机
对齐模块
生成事件
适配器