基于条件匹配流的语音合成方法、装置、设备及介质

正文

推荐专利

申请号：CN202510112861

申请日期：2025-01-23

公开号：CN119920236A

公开日期：2025-05-02

类型：发明专利

摘要

本发明属于语音处理技术领域，适用于医疗领域和金融领域，公开了一种基于条件匹配流的语音合成方法、装置、设备及介质，所述方法包括：将第二文本数据输入至语音合成模型的编码器中进行音频特征提取，对提取的音频特征向量进行掩码处理；获取待合成的第三文本数据，将第一音频特征向量和待合成的第三文本数据输入至语音合成模型的条件匹配流模块进行特征分布的调节，并基于条件匹配流模块的向量场和第二音频特征向量，将第一音频特征向量和待合成的第三文本数据转换为第三音频特征向量；将第三音频特征向量输入至语音合成模型的解码器中进行解码，得到待合成的第三文本数据生成的语音数据。本发明有效的提高了语音合成模型生成语音数据的效率。

技术关键词

数据样本音频特征提取中文文本解码器声学特征自动语音识别编码器可读存储介质特征提取模块生成语音处理器拼音解码模块计算机设备

基于条件匹配流的语音合成方法、装置、设备及介质

站点导航

APP 下载