摘要
本发明涉及一种生成方言语音合成大模型的方法,包括以下步骤:收集训练数据,训练数据包括音频和文本;构造训练数据,应用目标方言拼音和IPA映射将目标方言拼音精标逐音节替换成IPA精标,形成训练数据;生成模型,模型包括语义信息编码器、语音梅尔谱和生成模块;训练模型,使用大规模普通话数据对模型进行第一阶段训练;引入方言数据与适量配比的普通话数据对模型进行第二阶段训练,形成方言语音合成大模型。本发明可以生成高质量、多样化的方言语音。
技术关键词
拼音
信息编码器
语音
收集训练数据
语义
模块
汉字
文本
词语
音频
概念
机制
核心
噪声
标记
元素
序列
系统为您推荐了相关专利信息
描述符
图像复原方法
交叉注意力机制
退化特征
训练词向量模型
跨域推荐方法
混合推荐模型
因子
专业
特征匹配矩阵
场景类别
商品图像特征
动态展示方法
高斯混合模型
动态场景
图像处理神经网络
异常判断方法
上采样
异常信息
生成管道