一种生成方言语音合成大模型的方法

AITNT
正文
推荐专利
一种生成方言语音合成大模型的方法
申请号:CN202510984089
申请日期:2025-07-17
公开号:CN120636367A
公开日期:2025-09-12
类型:发明专利
摘要
本发明涉及一种生成方言语音合成大模型的方法,包括以下步骤:收集训练数据,训练数据包括音频和文本;构造训练数据,应用目标方言拼音和IPA映射将目标方言拼音精标逐音节替换成IPA精标,形成训练数据;生成模型,模型包括语义信息编码器、语音梅尔谱和生成模块;训练模型,使用大规模普通话数据对模型进行第一阶段训练;引入方言数据与适量配比的普通话数据对模型进行第二阶段训练,形成方言语音合成大模型。本发明可以生成高质量、多样化的方言语音。
技术关键词
拼音 信息编码器 语音 收集训练数据 语义 模块 汉字 文本 词语 音频 概念 机制 核心 噪声 标记 元素 序列
系统为您推荐了相关专利信息
1
一种混合型装备故障排查智能问答系统及方法
智能问答系统 混合型 意图识别 模块 装备
2
一种基于退化类型和程度联合感知的自适应图像复原方法
描述符 图像复原方法 交叉注意力机制 退化特征 训练词向量模型
3
跨域推荐方法、装置、设备、存储介质及程序产品
跨域推荐方法 混合推荐模型 因子 专业 特征匹配矩阵
4
一种基于多场景商品动态展示方法及系统
场景类别 商品图像特征 动态展示方法 高斯混合模型 动态场景
5
一种管道异常判断方法、装置、电子设备和存储介质
图像处理神经网络 异常判断方法 上采样 异常信息 生成管道
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号