语音数据处理方法、装置、设备及计算机可读存储介质

正文

推荐专利

申请号：CN202411993615

申请日期：2024-12-30

公开号：CN119851676B

公开日期：2025-12-12

类型：发明专利

摘要

本申请提供了一种语音数据处理方法、装置、设备及计算机可读存储介质；方法包括：从N个候选音色各自对应的候选音频数据中，确定目标音色对应的目标音频数据；获取第一音频数据、第一音频数据对应的第一文本，并对第一音频数据和第一文本进行编码处理，得到初始标记序列；当第一文本中包括至少两种语言时，将语言转换标记增加至初始标记序列，得到第一目标标记序列；基于目标音频数据，对第一目标标记序列进行特征转换，得到第一目标标记序列的第一音频特征；对第一音频特征进行语音转换，得到第一文本对应的第二音频数据，第二音频数据的音色为目标音色。通过本申请，能够提高语音数据的音色多样化，并对不同语言的语音数据进行个性化的音色统一。

技术关键词

标记音频特征语音数据处理方法序列文本生成对抗网络模型计算机可执行指令语音数据处理装置编码可读存储介质波形电子设备模块存储器处理器

语音数据处理方法、装置、设备及计算机可读存储介质

站点导航

APP 下载