一种生成方言语音合成大模型的方法

正文

推荐专利

一种生成方言语音合成大模型的方法

申请号：CN202510984089

申请日期：2025-07-17

公开号：CN120636367A

公开日期：2025-09-12

类型：发明专利

摘要

本发明涉及一种生成方言语音合成大模型的方法，包括以下步骤：收集训练数据，训练数据包括音频和文本；构造训练数据，应用目标方言拼音和IPA映射将目标方言拼音精标逐音节替换成IPA精标，形成训练数据；生成模型，模型包括语义信息编码器、语音梅尔谱和生成模块；训练模型，使用大规模普通话数据对模型进行第一阶段训练；引入方言数据与适量配比的普通话数据对模型进行第二阶段训练，形成方言语音合成大模型。本发明可以生成高质量、多样化的方言语音。

技术关键词

拼音信息编码器语音收集训练数据语义模块汉字文本词语音频概念机制核心噪声标记元素序列

系统为您推荐了相关专利信息

一种混合型装备故障排查智能问答系统及方法

智能问答系统混合型意图识别模块装备

一种基于退化类型和程度联合感知的自适应图像复原方法

描述符图像复原方法交叉注意力机制退化特征训练词向量模型

跨域推荐方法、装置、设备、存储介质及程序产品

跨域推荐方法混合推荐模型因子专业特征匹配矩阵

一种基于多场景商品动态展示方法及系统

场景类别商品图像特征动态展示方法高斯混合模型动态场景

一种管道异常判断方法、装置、电子设备和存储介质

图像处理神经网络异常判断方法上采样异常信息生成管道

一种生成方言语音合成大模型的方法

站点导航

APP 下载