一种语音合成方法、装置、计算机设备及存储介质

正文

推荐专利

申请号：CN202411517621

申请日期：2024-10-29

公开号：CN119339703A

公开日期：2025-01-21

类型：发明专利

摘要

本申请属于人工智能和金融、医疗领域，涉及一种语音合成方法，包括对待处理文本进行文本正则化，得到正则化文本；对所述正则化文本进行口语化改写，得到口语化文本；将所述口语化文本进行文本特征离散化，得到文本离散特征；对所述文本离散特征进行语音特征推理，得到语音离散特征；将所述语音离散特征进行解码，得到语音频谱信息；通过训练完成的声码器，将所述语音频谱信息转换为音频，输出合成语音。本申请还提供一种语音合成装置、计算机设备及存储介质。此外，本申请还涉及区块链技术，待处理文本可存储于区块链中。本申请能够确保生成清晰自然的语音，有效提高了文本到语音转换的质量和真实感，提高语音合成实时性能。

技术关键词

离散特征文本语音特征计算机可读指令频谱特征正则化模型语音解码器解码模型分词计算机设备音频声码器多头注意力机制叠层可读存储介质区块链技术编码规则

系统为您推荐了相关专利信息

针对目标话题的用户立场检测方法及系统、电子设备、存储介质

话题文本标签社交媒体平台图像分类模型

基于MPEG-7的模型训练、图像分类和图像检索方法

描述符矢量图数值图像检索方法图像分类方法

白屏检测方法、装置、设备及介质

网页页面白屏检测方法文本检测模型图片数据

一种基于多模态大模型提示生成的遥感图像舰船检测方法

注意力融合图像特征跨模态融合特征分支金字塔网络

电能计量器件的确定方法及设备、电能计量方法及电能表

电能计量器件文本特征向量大语言模型电能计量方法电能计量电路

一种语音合成方法、装置、计算机设备及存储介质

站点导航

APP 下载