基于人工智能的语音合成方法、装置及相关设备

正文

推荐专利

申请号：CN202411551411

申请日期：2024-10-31

公开号：CN119380695A

公开日期：2025-01-28

类型：发明专利

摘要

本申请涉及人工智能技术领域，公开了一种基于人工智能的语音合成方法、装置、电子设备及存储介质。该方法包括：获取待合成文本，以及语音提示数据；输入待合成文本至预设的音素编码器，通过音素编码器解析待合成文本，得到第一音素数据；输入语音提示数据至预设的韵律提取器，通过韵律提取器解析语音提示数据，得到第一韵律数据；输入语音提示数据至预设的第一语音编码器，通过第一语音编码器解析语音提示数据，得到第一语音特征提示数据；嵌入第一音素数据至第一韵律数据，得到第二韵律数据；通过预设的第二语音解码器的处理第二韵律数据和第一语音特征提示数据，得到目标合成语音。该方法提升了基于大语言模型进行语音合成的稳定性。

技术关键词

语音特征语音编码器语音解码器编码器解析非易失性计算机可读存储介质文本计算机可执行指令对齐工具数据模块基频估计算法端点检测算法电子设备多头注意力机制大语言模型人工智能技术数据获取模块处理器

基于人工智能的语音合成方法、装置及相关设备

站点导航

APP 下载