语音数据的重建方法、装置、计算机设备及存储介质

正文

推荐专利

申请号：CN202411724501

申请日期：2024-11-27

公开号：CN119559929A

公开日期：2025-03-04

类型：发明专利

摘要

本发明公开了一种语音数据的重建方法、装置、计算机设备及存储介质。所述方法包括：通过预设的文本编码器对音素文本执行编码处理后，得到输出向量；通过预设的说话人编码器对说话人提示语言进行编码处理后，得到全局说话人表示；通过预设的韵律模块对所述输出向量和所述全局说话人表示执行预测处理后，得到韵律表示向量；通过预设的解码器对所述韵律表示向量执行解码处理后，得到重建出的语音数据。本方案使用预设的韵律模块处理说话人编码器的全局说话人表示和文本编码器的输出向量，考虑到韵律的全局一致性和局部变化，捕捉当中韵律的分层变化，最终得到提升韵律质量的重建语音，可在自然度和情感表达方面表现更佳。

技术关键词

韵律模块正弦激励信号文本编码器语音噪声数据解码器适配器计算机设备分层神经网络参数可读存储介质处理器存储器

系统为您推荐了相关专利信息

数据备份方法、装置、设备及存储介质

声纹特征智能语音播放数据备份方法验证提示信息智能语音识别

语音识别模型微调方法、电子设备、存储介质及程序产品

语音识别模型字词微调方法记忆音频

一种基于语音识别的制动系统及方法

制动系统语音采集模块口令执行紧急制动语音识别模块

一种基于虚拟外呼的在线问诊系统及方法

在线问诊系统电子病历电话人脸识别验证云端

一种基于CLIP模型的事件相机数据分类算法

数据分类算法事件相机对齐模块生成事件适配器

语音数据的重建方法、装置、计算机设备及存储介质

站点导航

APP 下载